MySQL的binlog、redo log和undo log怎么使用

mysql的binlog、redo log和undo log怎么使用

1、binlog

Binlog是用于记录数据库中执行的写入操作的信息,它排除了查询操作,并且以二进制格式保存在磁盘上。binlog是mysql的逻辑日志,并且由Server层进行记录,使用任何存储引擎的mysql数据库都会记录binlog日志。

逻辑日志:可以简单得理解为sql语句;

物理日志:MySQL中数据都是保存在数据页中的,物理日志记录的是数据页上的变更;在这里插入代码片

binlog是通过追加的方式进行写入的,可以通过max_binlog_size参数设置每个binlog文件的大小,当文件大小达到给定值之后,会生成新的文件来保存日志。

binlog使用场景
项目 在实际应用中,binlog的主要使用场景有两个,分别是主从复制和数据恢复。

主从复制:在Master端开启binlog,然后将binlog发送到各个Slave端,Slave端重放binlog从而达到主从数据一致。

数据恢复:通过使用mysqlbinlog工具来恢复数据。

MySQL主从同步原理
MySQL的binlog、redo log和undo log怎么使用MySQL的binlog、redo log和undo log怎么使用

主节点 binlog dump 线程
当从节点连接主节点时,主节点会创建一个log dump 线程,用于发送binlog的内容。在读取binlog中的操作时,此线程会对主节点上的binlog加锁,当读取完成,甚至在发动给从节点之前,锁会被释放;

从节点I/O线程
当从节点上执行start slave命令之后,从节点会创建一个I/O线程用来连接主节点,请求主库中更新的binlog。I/O线程接收到主节点binlog dump进程发来的更新之后,保存在本地relaylog中;

从节点SQL线程
SQL线程负责读取relaylog中的内容,解析成具体的操作并执行,最终保证主从数据的一致性;
MySQL 数据库主从同步原理

binlog的内容
上面说了,binlog是一种逻辑日志,可以简单得理解为sql语句,但是实际上还包含着执行的sql语句的反向逻辑。delete对应着delete本身以及反向的insert信息;update包含着对应的update执行前后数据行的相关信息;insert包含自身的insert以及对应的delete信息。

binlog的格式
binlog共有三种格式,分别是statement、row以及mixed。MySQL 5.7.7版本之前默认使用的是statement,MySQL 5.7.7之后默认使用的是row。日志的格式可以通过my.ini配置文件中的binlog-format来修改。
(1)statement:基于sql语句的复制(statement-based replication,SBR),每一条修改数据的sql语句都会记录到binlog中。

优点:不需要具体记录某一行的变化,节约空间,减少io,提高性能;

缺点:在执行sysdate()或者sleep()等操作的时候,可能导致主从数据不一致的情况;

(2)row:基于行记录的复制(row-based replication,RBR),不记录sql语句上下文相关信息,而是记录哪条记录被修改的细节。

优点:非常详细地记录每一行记录修改的细节,因而不会出现数据无法被正确复制的情况;

缺点:由于会非常详细地记录每一条记录修改的细节,这样会产生大量的日志内容。假设现在有一条update语句,修改了很多条记录,则每条修改记录都会记录到binlog中。特别地,alter table这个操作,由于表结构的变化,每行记录都会发生变化,导致日志量暴增;

(3)mixed:根据上面所说的,statement和row各有优缺点,因此出现了mixed这个版本,将这二者进行混合。一般情况下使用statement格式来进行保存,当遇到statement无法解决时,切换为row格式来进行保存。
特别地,上面说了,新版本(MySQL 5.7.7之后)默认使用的row格式,这里的row也做了相应的优化,在遇到alter table这个操作时采用statement格式进行记录,其余操作仍然使用row格式。

binlog刷盘时机

对于InnoDB存储引擎来说,只有在事务提交的时候才会记录binlog,此时记录还在内存中,MySQL通过sync_binlog来控制binlog的刷盘时机,取值范围为0-N:

0:不强制刷到磁盘,由系统自行判断何时写入磁盘中;

1:每次提交后都要将binlog写入磁盘中;

N:每N个事务,才会将binlog写入磁盘中;

从上面可以看出,sync_binlog最安全的是设置是1,这也是MySQL 5.7.7之后版本的默认值。但是设置一个大一些的值可以提升数据库性能,因此实际情况下也可以将值适当调大,牺牲一定的一致性来获取更好的性能。

binlog的物理文件大小

通过配置max_binlog_size参数,可以控制binlog的大小,这一参数位于my.ini配置文件中。系统会创建一个新的文件以继续存储日志,当日志的大小超过binlog文件的容量限制时。当一个事务比较大时,或者是当日志越来越多的时候,此时占据的物理空间太大怎么办?MySQL提供了一种自动删除的机制,还是在my.ini配置文件中,可以通过配置expire_logs_days这个参数来解决,单位为天。当这个参数为0,表示永不删除;为N时,表示第N天后自动删除。

2、redo log

redolog是InnoDB引擎专有的日志系统。主要是用来实现事务的持久性以及实现crash-safe功能。redolog属于物理日志,记录的是sql语句执行之后数据页上的具体修改内容。
我们都知道,当MySQL运行的时候,会将数据从磁盘中加载到内存当中。当执行sql语句对数据进行修改时,修改后的内容其实都只是暂时保存到内存当中,如果此时断电或者出现其他情况,这些修改就会丢失。因而,当修改完数据之后,MySQL会寻找机会将这些内存中的记录刷回到磁盘当中。但这就出现一个性能问题,主要有两个方面:

InnoDB中是以页为数据单位与磁盘进行交互的,而一个事务很可能只是修改了一个页上的几个字节,如果将一个完整的数据页刷回磁盘当中,浪费资源;

SpeakingPass-打造你的专属雅思口语语料 SpeakingPass-打造你的专属雅思口语语料

使用chatGPT帮你快速备考雅思口语,提升分数

SpeakingPass-打造你的专属雅思口语语料 25 查看详情 SpeakingPass-打造你的专属雅思口语语料

一个事务可能涉及到多个数据页,这些数据页只是逻辑上连续,在物理上并不连续,使用随机IO性能太差;

因此,MySQL设计了redolog来记录事务对数据页具体做了哪些修改,之后将redolog再刷回磁盘当中。你可能会有疑惑,本来就是想减少io,这不又加上一次io么?InnoDB的设计者在设计之初就已经考虑到了这些。Redo log 文件通常都很小,而且在刷新磁盘的过程中采用的是顺序 I/O。与随机 I/O 相比,性能更好。

redo log基本概念
redolog由两部分组成,一个是内存中的日志缓存redo log buffer,一个是磁盘中的日志文件redo log file。当每次对数据记录进行修改的时候,都会将这些修改内容先写入redo log buffer中,后续等待合适的时机将内存中的修改刷回到redo log file中。这种先写日志,再写磁盘的技术就是WAL(Write-Ahead Logging)技术。需要注意的是redolog比数据页先刷回磁盘,聚簇索引,二级索引,undo页面的修改,均需要记录redolog。

在计算机操作系统中,用户空间(user space)下的缓冲区数据一般情况下是无法直接写入磁盘的,中间必须经过操作系统内核空间(kernel space)缓冲区(OS Buffer)。因此,redo log buffer写入redo log file实际上是先写入OS Buffer,然后再通过系统调用fsync()将其刷到redo log file中,过程如下:
MySQL的binlog、redo log和undo log怎么使用
mysql支持三种将redo log buffer写入redo log file的时机,可以通过innodb_flush_log_at_trx_commit参数配置,各参数值含义如下:

参数值 含义

0(延迟写)事务提交时不会将redo log buffer中日志写入到os buffer,而是每秒写入os buffer并调用fsync()写入到redo log file中。也就是说设置为0时是(大约)每秒刷新写入到磁盘中的,当系统崩溃,会丢失1秒钟的数据。1(实时写,实时刷)事务每次提交都会将redo log buffer中的日志写入os buffer并调用fsync()刷到redo log file中。这种方式即使系统崩溃也不会丢失任何数据,但是因为每次提交都写入磁盘,IO的性能较差。2(实时写,延迟刷)每次提交都仅写入到os buffer,然后是每秒调用fsync()将os buffer中的日志写入到redo log file。

MySQL的binlog、redo log和undo log怎么使用
redo log记录形式
redolog采用固定大小,循环写入的格式,当redolog写满之后,会重新从头开始写。为什么这么设计呢?
redo log存在的意义主要就是降低对数据页刷盘的要求。redolog记录了数据页上的修改,但是当数据页也刷回到磁盘后,这些记录就失去作用了。因此当MySQL判断之前的redolog已经失去作用之后,新数据会将这些失效的数据进行覆盖。那如何判断该不该进行覆盖呢?
MySQL的binlog、redo log和undo log怎么使用
上图是redo log file的示意图,write pos表示redolog当前记录的日志序列号LSN(log sequence number)。当数据页也已经刷回磁盘之后,会更新redo log file中的LSN,表示到这个LSN之前的数据已经落盘,这个LSN就是check point。write pos到check point之间的部分是redolog空余的部分,用于记录新的记录;check point到write pos之间是redolog已经记录的数据页修改部分,但此时数据页还未刷回磁盘的部分。当write pos追上check point时,会先推动check point向前移动,空出位置再记录新的日志。

启动innodb的时候,不管上次是正常关闭还是异常关闭,总是会进行恢复操作。恢复时,会先检查数据页中的LSN,如果这个LSN小于redolog中的LSN,即write pos位置,说明在redolog上记录着数据页上尚未完成的操作,接着就会从最近的一个check point出发,开始同步数据。

那有没有可能数据页中的LSN大于redolog中的LSN呢?答案是当然可能。出现这种情况时,这时超出redolog的部分将不会重做,因为这本身就表示已经做过的事情,无需再重做。
redo log与binlog区别

redo log binlog

文件大小redo log的大小是固定的。binlog可通过配置参数max_binlog_size设置每个binlog文件的大小。实现方式redo log是InnoDB引擎层实现的,并不是所有引擎都有。binlog是Server层实现的,所有引擎都可以使用 binlog日志记录方式redo log 采用循环写的方式记录,当写到结尾时,会回到开头循环写日志。binlog 通过追加的方式记录,当文件大小大于给定值后,后续的日志会记录到新的文件上适用场景redo log适用于崩溃恢复(crash-safe)binlog适用于主从复制和数据恢复

由binlog和redo log的区别可知:binlog日志只用于归档,只依靠binlog是没有crash-safe能力的。但只有redo log也不行,因为redo log是InnoDB特有的,且日志上的记录落盘后会被覆盖掉。因此需要binlog和redo log二者同时记录,才能保证当数据库发生宕机重启时,数据不会丢失。
两阶段提交
上面简单介绍了redolog和binlog,在对数据进行修改时,他们都会对这些修改进行保存落地,只是一个是物理日志,一个是逻辑日志。那他俩具体在修改过程中是如何执行的呢?

假设现在有一条update语句要执行,update from table_name set c=c+1 where id=2,执行流程如下:

先定位到id=2这一条记录;

执行器拿到引擎给的行数据,把这个值加上 1,得到新的一行数据,再调用引擎接口写入这行新数据;

引擎将这行新数据更新到内存中,同时将这个更新操作记录到redolog里面,此时 redolog 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务;

执行器生成这个操作的 binlog,并把binlog写入磁盘;

执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成;

示意图如下所示:
MySQL的binlog、redo log和undo log怎么使用
这种将redolog的写入拆分成prepare和commit两个步骤的过程称之为两阶段提交。

redolog 和binlog都可以用于表示事务的提交状态,而两阶段提交就是让这两个状态保持逻辑上的一致。如果不使用两阶段提交,而是先写其中一个再写另外一个可能会带来一些问题。

此时还是使用update来举例。假设当前id=2,有一个字段c=0,分别分析以下情况:
先写redolog再写binlog
假设先写redolog,当redolog写完,但是binlog还未写完的时候,此时MySQL突然出现异常导致重启。由于之前redolog已经写完,系统重启后,修改的记录仍然存在,所以恢复后这一行 c 的值是 1。但由于系统重启,binlog中并未有这条记录。之后备份日志的时候,存起来的binlog里面就没有这条语句。然后你会发现,如果需要用这个 binlog 来恢复临时库的话,由于这个语句的binlog丢失,这个临时库就会少了这一次更新,恢复出来的这一行 c 的值就是 0,与原库的值不同。
先写binlog再写redolog
假如先写binlog,然后写redolog的时候系统重启。重启之后,redolog中没有对c进行修改的记录,此时c的值还是0。但是 binlog里面已经记录了“把 c 从 0 改成 1”这个日志。所以,在之后用 binlog来恢复的时候就多了一个事务出来,恢复出来的这一行 c 的值就是 1,与原库的值不同。

因此,综上所述,如果是先写某一个日志再写另一个日志,就会出现数据库的状态与使用binlog恢复出来的库的状态不一致的情况。

3、undo log

undolog主要用来记录某条行记录被修改之前的状态,记录的是修改前的数据。使用undolog可以在事务回滚时将记录恢复到事务开始前的状态。事务的原子性和持久性也是依靠undolog来实现的。undo log主要记录了数据的逻辑变化,比如一条INSERT语句,对应一条DELETE的undo log,对于每个UPDATE语句,对应一条相反的UPDATE的undo log,这样在发生错误时,就能回滚到事务之前的数据状态。在数据恢复过程中,使用binlog和redolog相结合,可确保数据恢复的准确性。

undolog的作用流程如下所示:
MySQL的binlog、redo log和undo log怎么使用

在事务开始之前将修改前的版本写入到undo log中;

开始进行修改,将修改过的数据保存到内存当中;

将undolog持久化到磁盘当中;

将数据页刷回到磁盘当中;

事务提交;

和redolog一样,undolog也需要先于数据页刷回磁盘。如果undolog完整,可以使用其中记录的信息来回滚事务,以恢复数据。

在一个事务当中,可能会对同一条数据进行多次修改,那么是不是每一次修改前的记录都要记录到undolog中呢?这样的话,会导致undolog日志量太大,此时redolog就要上场了。在一个事务当中,如果是对同一条记录进行修改,undolog只会记录事务开始前的原始记录,当再次对这条记录进行修改时,redolog会记录后续的变化。数据恢复过程中,通过协调redolog和undolog的作用,前滚和回滚操作来完成数据的恢复。过程如下所示:
MySQL的binlog、redo log和undo log怎么使用

以上就是MySQL的binlog、redo log和undo log怎么使用的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/259974.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月4日 08:41:37
下一篇 2025年11月4日 08:44:36

相关推荐

  • C++中如何使用类型擦除_运行时多态实现

    c++++中类型擦除是一种在运行时统一处理不同类型的技术,通过隐藏具体类型信息实现手动多态。1. 定义抽象基类作为通用接口;2. 创建模板类实现该接口并转发操作;3. 使用包装类包含模板类实例指针,提供相同方法并转发调用。示例中drawable为抽象基类,circle和square为具体类型,dra…

    2025年12月18日 好文分享
    000
  • 静态检查融合:SonarQube + Clang实现C++自动审计

    静态检查融合是通过结合sonarqube规则引擎与c++lang分析能力提升c++代码审计效果的方法。1. 安装sonarqube服务器并配置数据库;2. 安装sonarscanner并配置环境变量;3. 安装clang及相关开发工具;4. 安装并配置sonarqube cfamily插件;5. 创…

    2025年12月18日 好文分享
    000
  • 什么是C++中的数据库索引优化?

    c++++中的数据库索引优化可以通过以下步骤实现:1)选择正确的索引类型,如b-tree适合范围查询;2)维护索引,平衡读写性能;3)使用复合索引提升多列查询性能;4)通过查询优化和性能监控调整索引策略。 C++中的数据库索引优化?这是一个有趣且复杂的主题,让我们深入探讨一下。 C++虽然主要用于系…

    2025年12月18日
    000
  • C++中的ORM框架是什么?

    c++++中的orm框架是一种工具,通过对象映射到数据库表,简化数据库操作。1)orm框架通过对象操作数据库,提高开发效率和代码可维护性。2)常见框架如cppdb、odb和soci,各有特点。3)使用时需注意映射关系、查询优化和性能考虑。 C++中的ORM(对象关系映射)框架是什么?简单来说,ORM…

    2025年12月18日
    000
  • C语言网络编程中数据库连接的优化措施问答

    优化措施:使用连接池预创建数据库连接,避免连接/断开开销。优化查询语句,只查询必要字段,避免通配符或子查询。使用批处理将多个操作组合成一个请求,减少网络开销。尽量使用乐观的锁定机制,减少锁定粒度。考虑使用无服务器数据库,由供应商管理数据库,减少开销。 C语言网络编程中数据库连接的优化措施 在C语言网…

    2025年12月18日
    000
  • C++ 函数库在哪些场景下使用?

    c++++ 函数库预先定义了代码模块,可用于处理常见任务,广泛应用于:输入/输出操作字符串操作数学运算此外,还有特定领域的场景,如:图形处理网络编程数据库连接示例:使用 matplotlibcpp 函数库绘制折线图,实现了便捷的图形化展示。 C++ 函数库的应用场景 简介C++ 函数库提供了预定义的…

    2025年12月18日
    000
  • C++框架内置功能在跨平台开发中的作用

    在跨平台开发中,c++++ 框架的内置功能发挥着至关重要的作用,包括:跨平台兼容性:在多平台上稳定运行,简化移植。图形用户界面 (gui) 支持:提供跨平台的 gui 库,无需编写平台特定代码。数据库集成:支持多种数据库系统,实现数据访问和操作的跨平台性。网络通信:提供网络通信机制,用于分布式应用程…

    2025年12月18日
    000
  • C++框架中的数据处理和存储机制

    本文介绍了 c++++ 框架中处理和存储数据的关键技术:数据处理:stl 容器(vector、map、set)boost 库(额外容器和算法)eigen 库(优化矩阵和向量)数据存储:关系数据库管理系统(rdbms)(mysql、postgresql、sqlite)文档存储(mongodb、redi…

    2025年12月18日
    000
  • C++框架在行业中的实际案例

    c++++ 框架广泛应用于行业中,提供高效且可维护的代码解决方案。这些框架用于开发跨平台 gui(qt)、科学计算(armadillo、eigen)、线性代数运算(eigen)、计算机视觉(opencv)和高性能网络应用程序(ace)。例如,spotify 使用 boost(线程管理和网络操作)、a…

    2025年12月18日
    000
  • C++框架在后端开发方面的优缺点?

    c++++框架在后端开发中的优缺点:优点:高性能低内存使用跨平台原生数据库支持丰富的库生态缺点:学习曲线陡峭内存管理复杂缺乏动态关注编译时间长缺乏垃圾回收 C++ 框架在后端开发中的优缺点 优点: 高性能: C++ 是一种编译语言,可生成高效机器码,从而实现优异的性能。低内存使用: C++ 提供直接…

    2025年12月18日
    000
  • 在线资源和教程如何帮助降低 C++ 框架的学习难度?

    通过在线资源和教程,你可以降低 c++++ 框架的学习难度:利用官方文档和外部教程学习框架的基本概念和最佳实践。加入 stack overflow 和讨论论坛等社区,寻求具体问题的帮助和支持。通过构建 restful api、数据库应用程序和网络服务器等实战案例,获得实践经验。 通过在线资源和教程降…

    2025年12月18日
    000
  • 不同C++框架在特定领域的专业化和适用性对比

    不同的 c++++ 框架针对特定领域进行了专业化,以优化性能和易用性。对于 web 开发,boost.asio 以其轻量级和跨平台能力脱颖而出。用于 gui 开发的 qt 提供了丰富的功能和跨平台支持,而 qtsql 简化了数据库访问。poco 在网络编程中很突出,openmp 在并行计算中表现出色…

    2025年12月18日
    000
  • C++ 框架如何优化大型项目中资源管理和性能

    c++++ 框架通过资源管理和性能优化,提升了大型项目的效率:资源管理优化:通过资源池和智能指针管理资源,优化分配和释放操作。性能优化:利用并发编程和内存管理库,实现跨平台并发编程和提升内存管理性能。 C++ 框架:优化大型项目中资源管理和性能 大型 C++ 项目经常面临资源管理和性能问题。为了解决…

    2025年12月18日
    000
  • C++ 框架性能基准:与其他语言和平台的比较

    基准测试结果表明,c++++ 框架在 http 请求处理和数据库查询方面表现优异,boost.asio 适用于高并发连接,cpp-httplib 和 libuv 具有较低延迟。开发人员应根据不同场景选择最合适的框架。 C++ 框架性能基准:与其他语言和平台的比较 引言 性能是任何软件应用程序的关键方…

    2025年12月18日
    000
  • C++ 框架在网络安全领域的应用:提升网络抵御能力与威胁防御

    c++++ 框架在网络安全中广泛应用,提升网络抵御和威胁防御能力:高性能:c++ 速度和效率使其适合构建实时网络安全应用。内存管理:c++ 提供对内存的细粒度控制,确保安全和资源高效。跨平台支持:c++ 可在多种平台编译,便于构建跨平台安全解决方案。应用包括:入侵检测系统、防火墙、恶意软件分析和取证…

    2025年12月18日
    000
  • C++ 框架的学习指南:快速上手

    对于使用 c++++ 框架,本指南提供了分步指导,包括:了解基础知识:熟悉框架概念和 oop 原则。探索框架功能:容器、算法、线程管理、网络操作和数据库集成。实战案例:创建一个文件管理程序,演示框架的使用。扩展知识:探索其他框架、参与社区和练习项目。 C++ 框架的学习指南:快速上手 随着 C++ …

    2025年12月18日
    000
  • C++ 框架设计中实现代码重用的技术

    在 c++++ 框架设计中,实现代码重用的技术包括:模板方法模式:定义算法大纲,由子类定义具体步骤。策略模式:分离算法实现和使用对象,提高灵活性。工厂方法模式:创建对象的方法由子类实现,允许创建不同类型对象。抽象工厂模式:创建相关对象家族的方法,无需指定具体类,促进松耦合。单例模式:确保类只有一个实…

    2025年12月18日
    100
  • c++是什么语言

    C++ 是一种通用、面向对象、跨平台的编程语言,由比雅尼·斯特劳斯特鲁普开发于 1985 年。它具有面向对象、跨平台、高效、可扩展和低级控制等特点。C++ 被广泛应用于开发操作系统、数据库管理系统、游戏引擎、网络应用程序和大型企业软件。其优点包括效率高、可移植性好、面向对象和强大;缺点则包括复杂性、…

    2025年12月18日
    000
  • C++ 开源库指南:探索丰富的库资源,拓展编程能力

    c++++开源库为开发者提供了丰富的工具,包括:boost库:提供算法和数据结构,可用于字符串操作和图表处理。eigen:线性代数库。opencv:计算机视觉和机器学习库。qt:跨平台gui框架。mysql connector:与mysql数据库交互的库。wxwidgets:图形用户界面库。选择最合…

    2025年12月18日
    000
  • c++怎么连接数据库

    在C++中,可以使用ODBC或第三方库连接到数据库。ODBC步骤:初始化环境,连接到DBMS。其他库:MySQL Connector/C++、PostgreSQL libpq++、SQLite3,根据数据库类型和需求选择库。 C++连接数据库 在C++中连接数据库,可以使用标准的C++数据库连接库(…

    2025年12月18日
    000

发表回复

登录后才能评论
关注微信