InnoDB学习(三)之BinLog

BinLog又称为二进制日志,是MySQL服务层的数据日志,MySQL所有的存储引擎都支持BinLog。BinLog记录了MySQL中的数据更新和可能导致数据更新的事件,可以用于主从复制或数据恢复。本文会对BinLog的原理进行详细介绍。

BinLog

MySQL的BinLog用于记录MySQL的所有数据变更和可能造成数据变更的事件,这些BinLog以二进制日志的形式顺序存储在磁盘中。用户不能直接通过文本编辑器查看BinLog的内容,需要借助MySQL提供的mysqlbinlog工具才能查看文件。

需要注意的是,MySQL的BinLog位于Server层,所有的数据库引擎都支持BinLog。MySQL的分层结构如下所示:

MySQL

BinLog的开启

MySQL中可以通过以下命令查看BinLog是否开启,默认情况下MySQL5.7的BinLog处于关闭状态:

show variables like '%log_bin%';

BinLog状态

可以通过在MySQL配置文件[mysqld]中添加如下配置,然后重启MySQL服务,达到开启BinLog的目的:

[mysqld]
log-bin=mysql-bin

添加配置并重启容器后,可以看到BinLog的状态已经变为ON

BinLog状态

BinLog的切换

如果在my.cnf里面只设置log-bin=mysql-bin,但是不指定file_name,重启数据库后,MySQL的BinLog文件名称为mysql-bin格式,我们可以通过以下命令查看正在写的日志文件名:

show master status 

如果你希望切换当前写的日志文件为下一个文件,可以通过执行以下命令进行切换:

flush logs;

BinLog切换

每次重启MySQL服务也会生成一个新的二进制日志文件,相当于二进制日志切换。切换二进制日志时,你会看到日志文件末尾的数字会不断递增。另外,除了这些BinLog文件外,MySQL还会生成了一个DB-Server-bin.index的文件,这个文件中存储所有二进制日志文件的清单,又称为二进制文件的索引。

BinLogs删除

我们可以通过以下命令查看所有二进制文件的文件名称:

show binary logs;

BinLog列表

MySQL的BinLog可以手工删除,也可以设置自动清理,手工删除有以下删除命令:

  • purge binary logs to mysql-bin.000001:删除某个日志之前的所有二进制日志文件。这个命令会修改index中相关数据;
  • purge binary logs before '2017-03-10 10:10:00':清除某个时间点以前的二进制日志文件;
  • purge master logs before date_sub( now( ), interval 7 day):清除7天前的二进制日志文件;
  • reset master:清除所有的二进制日志文件(当前不存在主从复制关系);

自动清理可以通过设置expire_logs_days变量来启用,默认值为0,表示不启用过期自动删除功能,如果启用了自动清理功能,表示超出此天数的二进制日志文件将被自动删除,自动删除工作通常发生在MySQL启动时或FLUSH日志时。

BinLog过期

BinLog的格式

MySQL有三种BinLog格式,各有优劣:

  1. Statement格式的BinLog:此模式下MySQL会记录所有可能会变更数据的SQL语句;
  2. Row格式的BinLog::此模式下会记录数据库每一行数据的变化情况;
  3. Mixed格式的BinLog:Statement和Row格式的混合;

MySQL中可以通过以下命令查看BinLog的格式:

show variables like 'binlog_format'

BinLog格式

Statement格式的BinLog

Statement格式的BinLog会记录每一条可能修改数据库数据的sql语句,主从复制或数据恢复时可以在对应机器上执行同样的SQL来达到数据的一致。然而Statement不支持一些特殊的SQL语句,如语句中包含UUID函数/LOAD DATA IN FILE语句等。

和启用BinLog的方式类似,我们可以通过设置MySQL的配置文件来修改BinLog的格式,通过如下配置我们可以设置MySQL的BinLog格式为Statement格式:

[mysqld]
log-bin=mysql-bin
binlog-format="STATEMENT"

修改配置文件之后,重启MySQL,新生成的BinLog就是Statement格式了:

BinLog Statement

也可以在MySQL启动时添加参数--binlog-format=STATEMENT设置BinLog的格式为Statement.

BinLog格式为Statement格式下,我们切换到新的BinLog文件,并向数据库的表中插入数据:

flush logs;
insert into user_info (age, name) VALUES (1,'ssss')

上述语句执行完之后,MySQL会生成一个新的BinLog文件,通过show binlog events in 'mysql-bin.000004'语句,我们可以看到BinLog中存储了上述的Insert语句以及对应的数据库等信息:

Statement Demo

Row格式的BinLog

Row格式的BinLog会记录每一行数据被修改的情况,但是Row格式的BinLog往往会比较大。比如对于SQL语句update user_info set name='test' where 1=1,Statement格式的BinLog只会存储这条SQL语句,但是对于Row格式的BinLog,生成日志的大小就取决于表的大小,如果表中有1亿条数据,那么就需要生成1亿条BinLog记录。

和Statement格式类似,我们可以通过如下配置设置MySQL的BinLog格式为Row格式:

[mysqld]
log-bin=mysql-bin
binlog-format="ROW"

也可以在MySQL启动时添加参数--binlog-format=ROW设置BinLog的格式为Row.

修改配置文件之后,重启MySQL,新生成的BinLog就是ROW格式了。同样的,我们向数据库的表中插入数据,切换搭到新的BinLog文件,并一次更新多条的数据:

flush logs;
insert into user_info (age, name) VALUES (2,'aaaa');
insert into user_info (age, name) VALUES (1,'aaaa');

flush logs;
update user_info set name='sss' where 1=1;

通过mysqlbinlog mysql-bin.000012 -vv语句,我们可以看查看到上述的Insert语句的BinLog信息。Row格式下,BinLog记录了每一行数据值的变更情况:

Statement Demo

Row格式的BinLog也有不同的记录方式,可以通过参数binlog_row_format设置。FULL: 记录修改行的所有列数据;MINIMAL: 仅记录修改行中有发生数据变化的列;NOBOLB: 和FULL方式相似,仅仅是当blog或text这些列没有进行修改时,不会记录这些属性的列

Mixed格式的BinLog

通过上面的分析,我们知道BinLog的Statement和Row格式各有优缺点:

  • Statement格式:优点:日志量小,节约磁盘和网络IO;缺点:需要记录语句的上下文(如时间等),不具有确定性的函数(如UUID)无法复制;
  • Row格式:优点:可以记录数据库的所有变更;缺点:如果单个SQL语句涉及的行均比较多,那么会导致日志量非常大;

Mixed格式的BinLog结合了Statement和Row格式的优点,对于普通的SQL语句使用Statement格式的BinLog记录,对于一些特殊的SQL(如包含UUID的SQL),使用ROW格式的BinLog记录。

对于数据库隔离级别为读已提交或读未提交的场景,Mixed会使用会使用ROW格式的BinLog存储记录。

和Statement格式类似,我们可以通过如下配置设置MySQL的BinLog格式为MIXED格式:

[mysqld]
log-bin=mysql-bin
binlog-format="MIXED"

也可以在MySQL启动时添加参数--binlog-format=MIXED设置BinLog的格式为MIXED.

接下来我们切换搭到新的BinLog文件,并执行两条SQL,一条可以用Statement格式的BinLog记录,另外一条不可以:

flush logs;
insert into user_info (age, name) VALUES (1,'aaaa');
insert into user_info (age, name) VALUES (RAND(),'bbbb');

从下图使用mysqlbinlog --base64-output=DECODE-ROWS -v mysql-bin.000014命令解析的日志文件可以看出,对于第一条SQL语句insert into user_info (age, name) VALUES (1,'aaaa');,BinLog使用Statement格式记录,对于第二条SQL语句insert into user_info (age, name) VALUES (RAND(),'bbbb');,由于插入语句中包含随机数,无法通过Statement复制,MySQL使用了Row格式的BinLog记录了行数据的变更。

Mixed Demo

BinLog的作用

MySQL的BinLog主要有以下两个作用:

  1. 数据恢复:数据库数据丢失后,我们可以从某个时间节点的数据备份和该时间点之后的BinLog来恢复数据库的数据;
  2. 主从复制:主从复制过程中,主数据库将自身的BinLog发送给从数据库,从数据库通过解析BinLog同步主数据库的数据变更,从而达到主从数据一致;

数据恢复

MySQL数据库可以恢复某个时间点的状态,这个恢复过程就是通过BinLog实现的。BinLog会记录数据库所有的逻辑操作,并且是采用“追加写”的形式。如果你的DBA承诺说半个月内可以恢复,那么备份系统中一定会保存最近半个月的所有BinLog,同时系统会定期做整库备份。这里的“定期”取决于系统的重要性,可以是一天一备,也可以是一周一备。

当需要恢复到指定的某一秒时,比如某天下午两点发现中午十二点有一次误删表,需要找回数据,那你可以这么做:

  1. 首先,找到最近的一次全量备份,如果你运气好,可能就是昨天晚上的一个备份,从这个备份恢复到临时库;
  2. 然后,从备份的时间点开始,将备份的BinLog依次取出来,重放到中午误删表之前的那个时刻。

这样你的临时库就跟误删之前的线上库一样了,然后你可以把表数据从临时库取出来,按需要恢复到线上库去。

主从复制

在高并发的场景下,单节点的MySQL无法满足并发量需求,这时就可以通过新增MySQL实例来提升性能。新增MySQL实例有多种方式,本节只介绍主从机制。

MySQL的主从复制是一个异步的复制过程,数据将从一个MySQL数据库(Master)复制到另一个MySQL数据库(Slave),在Master和Slave之间实现整个主从复制的过程是由三个线程参与完成的。其中两个线程(SQL线程和IO线程)在Slave端,另一个线程(I/O线程)在Master端。

要实现MySQL的主从复制,首先必须打开Master端的binlog记录功能,否则就无法实现。MySQL主从复制的步骤如下所示:

Mast slave Demo

根据上图分析主从复制的流程,可以看出MYSQL主从复制包含以下步骤:

  1. 在Slave服务器上执行start slave命令开启主从复制开关,开始进行主从复制。
  2. Slave服务器的IO线程会通过在master上已经授权的复制用户权限请求连接Master服务器,并请求从执行binlog日志文件中的指定位置(日志文件名和位置就是在配置主从复制服务时执行change master命令指定的)之后开始发送binlog日志内容。
  3. Master服务器接收来自Slave服务器的IO线程的请求后,其上负责复制的IO线程会根据Slave服务器的IO线程请求的信息分批读取指定binlog日志文件指定位置之后的binlog日志信息,然后返回给Slave端的IO线程。返回的信息中除了binlog日志内容外,还有在Master服务器端记录的IO线程。返回的信息中除了binlog中的下一个指定更新位置。
  4. 当Slave服务器的IO线程获取到Master服务器上IO线程发送的日志内容、日志文件及位置点后,会将binlog日志内容依次写到Slave端自身的RelayLog(即中继日志)文件(Mysql-relay-bin.xxx)的最末端,并将新的binlog文件名和位置记录到master-info文件中,以便下一次读取master端新binlog日志时能告诉Master服务器从新binlog日志的指定文件及位置开始读取新的binlog日志内容
  5. Slave服务器端的SQL线程会实时检测本地Relay Log 中IO线程新增的日志内容,然后及时把Relay LOG 文件中的内容解析成sql语句,并在自身Slave服务器上按解析SQL语句的位置顺序执行应用这样sql语句,并在relay-log.info中记录当前应用中继日志的文件名和位置点

BinLog相关参数

  1. log_bin_basename:Since-MySQL 5.6.2,用于指定二进制文件名,默认值为datadir + '/' + hostname + '-bin'。 该参数不需要设置,也不能在my.cnf中设置,否则会报错;
  2. log_bin_index:Since-MySQL 5.6.4,二进制日志的索引文件名,可以在my.cnf中设置;
  3. log_bin_trust_function_creators:默认为OFF,这个参数开启会限制存储过程、Function、触发器的创建;
  4. sql_log_bin:控制会话级别二进制日志功能的开启或关闭,默认为ON,表示启用二进制日志功能;
  5. expire_logs_days:BinLog保留的时长;
  6. binlog_cache_size:为每个客户端分配binlog_cache_size大小的缓存,默认值32768。BinLog缓存使用的前提条件是服务器端使用了支持事务的引擎以及开启了BinLog功能,它是MySQL用来提高BinLog的效率而设计的一个用于短时间内临时缓存BinLog数据的内存区域。一般来说,如果我们的数据库中没有什么大事务,写入也不是特别频繁,2MB~4MB是一个合适的选择。但是如果我们的数据库大事务较多或多事务语句,写入量比较大,可适当调高binlog_cache_size。同时,我们可以通过binlog_cache_use 以及 binlog_cache_disk_use来分析设置的binlog_cache_size是否足够,是否有大量的binlog_cache由于内存大小不够而使用临时文件(binlog_cache_disk_use)来缓存了;
  7. max_binlog_cache_size: BinLog能够使用的最大内存缓存的大小。当执行多语句事务时,max_binlog_cache_size如果不够大,系统可能会报出“Multi-statement transaction required more than ‘max_binlog_cache_size’ bytes of storage”的错误;
  8. max_binlog_stmt_cache_size:max_binlog_cache_size针对事务语句,max_binlog_stmt_cache_size针对非事务语句,当我们发现Binlog_cache_disk_use或者Binlog_stmt_cache_disk_use比较大时就需要考虑增大cache的大小;
  9. max_binlog_size:表示二进制日志的最大值,一般设置为512M或1GB,但不能超过1GB。该设置并不能严格控制二进制日志的大小,尤其是二进制日志比较靠近为不而又遇到一根比较大事务时, 为了保证事务的完整性,不可能做切换日志的动作,只能将该事务的所有SQL都记录进当前日志,直到事务结束;
  10. binlog_checksum:主从校检复制时的数据校验,NONE表示不生成checksum,CRC-32表示使用这个算法做校检
  11. binlog_format:指定二进制日志的类型,分别有STATEMENT、ROW、MIXED三种值,MySQL 5.7.6之前默认为STATEMENT模式,MySQL 5.7.7之后默认为ROW模式,这个参数主要影响主从复制。
  12. sync_binlog:这个参数对于Mysql系统来说是至关重要的,它不仅影响到二进制日志文件对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性:

    sync_binlog=0,当事务提交后,Mysql仅仅是将binlog_cache中的数据写入binlog文件,但不执行fsync之类的磁盘同步指令通知文件系统将缓存刷新到磁盘,而是让Filesystem自行决定什么时候来做同步。MySQL中默认的设置是sync_binlog=0,即不作任何强制性的磁盘刷新指令,这个设置性能是最好的,但风险也是最大的。一旦系统崩溃(Crash),在文件系统缓存中的所有二进制日志信息都会丢失。从而带来数据不完整问题。sync_binlog=n,在进行n次事务提交以后,Mysql将执行一次fsync之类的磁盘同步指令,同时文件系统将Binlog文件缓存刷新到磁盘。可以适当的调整sync_binlog, 在牺牲一定的一致性下,获取更高的并发和性能。

我是御狐神,欢迎大家关注我的微信公众号:wzm2zsd

qrcode_for_gh_83670e17bbd7_344-2021-09-04-10-55-16

参考文档

MySQL官方文档 Binlog详解 binlog浅析 mysql二进制日志格式化_Mysql 二进制日志及格式选择 彻底解析Mixed日志格式的binlog (七) MySQL主从复制及读写分离实战

本文最先发布至微信公众号,版权所有,禁止转载!

<think>嗯,用户问的是关于MySQL的binlog,也就是二进制日志。我需要先回忆一下binlog的基本概念和作用。首先,binlog是MySQL服务器层维护的一种日志文件,用来记录所有对数据库的修改操作,比如INSERT、UPDATE、DELETE这些数据变更语句,以及DDL语句,比如CREATE TABLE、ALTER TABLE等。这一点我记得没错吧? 接下来,binlog的主要用途是什么?用户可能想知道为什么需要这个日志。我记得主要有个作用:主从复制、数据恢复和审计。主从复制中,主库的binlog会被发送到从库,从库重放这些日志来保持数据同步。数据恢复方面,可以通过binlog进行时间点恢复,比如全量备份加上binlog恢复到某个时间点。审计的话,可以分析binlog来查看数据库的历史操作,不过可能需要借助其他工具。 然后,binlog的格式有种:STATEMENT、ROW和MIXED。STATEMENT记录的是SQL语句本身,ROW记录的是每行数据变化,MIXED则是两种混合,根据情况自动选择。每种格式的优缺点需要解释清楚。比如STATEMENT节省空间但可能主从不一致,ROW更详细但日志量大,MIXED结合两者优势。 用户可能还想知道如何配置binlog,比如在my.cnf中设置参数,比如log_bin、binlog_format、expire_logs_days这些参数的作用。需要说明如何开启binlog,调整格式,设置过期时间等。 另外,使用mysqlbinlog工具查看和分析binlog文件,比如如何导出为可读的SQL语句,或者根据时间点恢复数据。这部分操作可能需要具体命令示例,但用户是否需要呢?可能用户是开发者或者DBA,所以给出基本命令会有帮助。 还要注意权限问题,用户可能需要SUPER权限才能查看或操作binlog。另外,binlog数据安全的关系,比如未加密传输的风险,或者日志文件的管理策略,比如定期清理过期日志,避免占用过多磁盘空间。 有没有可能用户的问题背后有更深层的需求?比如他们遇到了主从同步的问题,或者需要做数据恢复,所以想了解binlog的工作原理。这时候需要确保回答足够详细,覆盖常见使用场景和注意事项。 最后,确保语言口语化,避免技术术语堆砌,但又要准确。比如用“记录所有修改操作”而不是“记录数据变更事件”,这样更易懂。检查是否有遗漏的重要点,比如binlog的写入机制,事务提交时写入,确保数据一致性。 总结一下,回答的结构应该是:定义、作用、格式、配置、使用工具、注意事项。这样用户能逐步理解binlog是什么,为什么重要,怎么用。如果有错误的地方需要纠正,比如binlog属于服务器层而不是存储引擎层,这一点要确认正确。</think>好的,我来逐步解释MySQL的**二进制日志(binlog)**: --- ### 1. **什么是binlog?** - **本质**:MySQL服务器生成的**二进制日志文件**(非文本文件) - **作用**:记录所有对数据库的**修改操作**(增删改、表结构变更等) - **特点**: - **持久化存储**:即使服务器重启,日志仍保留 - **顺序写入**:高性能设计,不影响数据库主业务 - **事务安全**:记录与事务提交保持一致性 --- ### 2. **核心用途** | 用途 | 说明 | |---------------------|--------------------------------------------------------------------| | **主从复制** | 主库的binlog发送到从库,从库重放日志实现数据同步(核心机制) | | **数据恢复** | 通过全量备份 + binlog回放,恢复到任意时间点(如误删数据后恢复) | | **审计分析** | 解析日志可追溯历史操作(需配合工具如`mysqlbinlog`或第方审计系统) | --- ### 3. **binlog种格式** | 格式 | 记录内容 | 优点 | 缺点 | |------------|-------------------------------------|-----------------------------|-----------------------------| | **STATEMENT** | 原始SQL语句 | 日志体积小 | 主从不一致风险(如使用`NOW()`) | | **ROW** | 每行数据变化(默认格式) | 数据一致性高 | 日志体积大(尤其批量操作) | | **MIXED** | 混合模式(自动选择STATEMENT或ROW) | 平衡日志量和一致性 | 复杂场景仍需人工干预 | --- ### 4. **关键配置参数** 在MySQL配置文件(如`my.cnf`)中设置: ```ini [mysqld] server_id = 1 # 主从复制的唯一标识(必填) log_bin = /var/lib/mysql/mysql-bin # 启用binlog并指定路径 binlog_format = ROW # 推荐使用ROW格式 expire_logs_days = 7 # 自动清理7天前的日志 max_binlog_size = 100M # 单个日志文件最大100MB ``` --- ### 5. **常用操作命令** #### 查看binlog内容 ```bash mysqlbinlog --base64-output=decode-rows -v mysql-bin.000001 ``` - `--base64-output=decode-rows`:解码ROW格式的二进制数据 - `-v`:输出可读性更强的信息 #### 数据恢复示例 ```bash # 恢复到指定时间点 mysqlbinlog --start-datetime="2023-10-01 09:00:00" \ --stop-datetime="2023-10-01 10:00:00" \ mysql-bin.000001 | mysql -u root -p ``` --- ### 6. **注意事项** - **权限要求**:操作binlog需`SUPER`权限(MySQL 8.0+需`BINLOG ADMIN`权限) - **性能影响**:ROW格式在高并发写入时可能产生大量日志,需监控磁盘空间 - **安全风险**:binlog明文记录数据变更,敏感场景建议启用TDE(透明数据加密) - **清理策略**:避免用`rm`直接删除文件,应使用`PURGE BINARY LOGS`命令 --- ### 7. **常见问题** - **Q:binlog和redo log的区别?** - binlog:服务层日志,用于复制/恢复,逻辑记录 - redo log:InnoDB引擎日志,用于崩溃恢复,物理记录 - **Q:如何跳过某个错误的binlog事件?** - 在从库执行`SET GLOBAL SQL_SLAVE_SKIP_COUNTER=1;`后重启复制 如果对某个具体场景(如主从搭建、恢复误删数据)感兴趣,可以告诉我进一步展开说明~ 😊
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

-御狐神-

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值