mysql 的三种日志
Mysql数据库为什么可以实现主从复制,持久化,回滚,
关键在于mysql里的三种log,分别是:
- binlog
- redo log
- undo log
binlog
- 什么是binlog
binlog是用于记录数据库表结构和表数据变更的二进制日志。
比如insert,update,delete,create,truncate等等操作,
不会记录select,show操作,因为没有对数据本身发生变更。
binlog 会记录下每条变更的sql语句,还有执行开始时间,
结束时间,事务id等等信息。
binlog是通过追加的方式写入的,可以通过max_binlog_size参数设置每个binlog文件的大小,当文件大小达到给定值以后,会生成新的文件来保存日志 - binlog使用场景
主从复制和数据恢复
- 主从复制 在master端开启binlog,从机订阅binlog日志的信息
然后将binlog发送到各个slave端,slave端重放binlog,从而达到主从数据一致。 - 数据恢复 通过使用mysqlbinlog工具来恢复数据。
指定–start-position和stop-position,或者指定–start-datetime和stop-datetime,那么就可以恢复指定区间的数据。
-
binlog主从复制原理
-
binlog输盘时机
对于InnoDB存储引擎而言,只有在事务提交时才会记录binlog,此时记录还在内存里面;
mysql通过sync_binlog参数控制binlog的刷盘时机,取值范围是0-N
0:不去强制要求,由系统自行判断何时写入磁盘;
1:每次commit的时候都要将binlog写入磁盘;
N:没N个事务,才会将binlog写入磁盘。
从上面可以看出,sunc_binlog最安全的设置是1,这也是mysql 5.7.7之后版本的默认值。
因此实际情况下也可以将值适当调大,牺牲一定的一致性来获取更好的性能。 -
binlog日志格式
binlog日志有三种格式,分别是STATMENT,ROW,MIXED。
在mysql 5.7.7之前,默认的格式是STATEMENT,MYSQL 5.7.7之后,默认的是ROW。
日志格式通过binlog-format指定
STATMENT
基于SQL语句的复制
每一条会修改数据的sql都会记录到binlog中。
优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,从而提高了性能。
缺点:在某些情况下会导致主从数据不一致,比如执行sysdate(),sleep()等。
ROW
基于行的复制
不记录每条sql语句的上下文信息,仅需记录哪条数据被修改了
优点:不会出现某些特定情况下的存储过程,或function,或trigger的调用和触发无法被正确复制的问题;
缺点:会产生大量的日志,尤其是alter,table的时候会让日志暴涨
MIXED
基于STATEMENT和ROW两种模式的混合复制
一般的复制使用STATEMENT模式保存binlog,对于STATEMENT模式无法复制的操作使用ROW模式保存binlog
redo log
为什么需要redo log?
事务的四大特性里面有一个是持久性,具体来说就是只要事务提交成功,那么对数据库做的修改就被永久保存下来了,不可能因为任何原因再回到原来的状态。
主要体现在两个方面:
因为Innodb是以页为单位进行磁盘交互,而一个事务很可能只修改一个数据也里面的几个字节,这个时候将完整的数据页刷到磁盘的话,太浪费资源了!
还有就是一个事务可能涉及修改多个数据页,并且这些数据页在物理上并不连续,使用随机IO写入性能太差!
因此,mysql设计了redo log,具体来说就是只记录事务对数据页做了哪些修改,这样就能完美地解决性能问题了(相对而言文件更小并且是顺序IO)。
redo log结构
redo log和bin log的区别
undo log
undo log的作用主要用于回滚,mysql数据库的事务的原子性就是通过undo log实现的
我们都知道原子性是指对数据库的一系列操作,要么全部成功,要么全部失败。undo log主要存储的是数据的逻辑变化日志,比如说我们要insert一条数据,要么undo log就会生成一条对应的delete日志。
简单点说,undo log记录的是数据修改之前的数据,因为需要回滚。
那么当需要回滚时,只需要利用undo log的日志就可以恢复到修改前的数据。undo log另一个作用是实现多版本并发控制(MVCC),undo log记录中包含了记录更改前的镜像,如果更改数据的事务未提交,对于隔离级别大于等于read commit的事务而言,不应该返回更改后的数据,而应该返回老版本的数据