mysql binlog线程恢复_使用MySQL SQL线程回放Binlog实现恢复

本文详细介绍了如何使用MySQL的SQL线程回放binlog进行数据恢复,包括全量备份、模拟数据变化、恢复流程、单库和单表恢复、指定GTID点恢复以及效率优化。通过实验对比,表明SQL线程恢复相比mysqlbinlog具有更高的效率和灵活性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 需求部分

1.1 基于MySQL复制同步特性,尝试使用Replication的SQL线程来回放binlog,可基于以下逻辑模拟场景

做全量xtrabackup备份模拟日常备份

执行sysbench压测4张表,20个线程,压测10分钟,模拟大量binlog

删除实例模拟数据库被误删除或硬件故障(binlog需要保留)

使用xtrabackup恢复全量备份

使用MySQL Replication SQL线程回放binlog(提示:恢复前需要将relay_log_recocery参数设置为0)

1.2 基于题目1.1,考虑是否可以做到以下场景的恢复

只恢复单个库的数据

只恢复单个表的数据

将数据恢复到指定的GTID或者position点(如恢复到误操作drop之前的GTID)

是否可以通过参数调整提升回放效率,列出提升效率的参数并实际测试用SQL线程回放binlog和直接使用mysqlbinlog回放binlog的性能对比

2.操作部分

2.1 环境准备及故障模拟

使用mysqlbinlog将binlog文件实时转储到备份目录(当前环境备份目录配置在/data/mysql/backup)

[root@10-186-61-162 ~]# mkdir -p /data/mysql/backup/binlog

[root@10-186-61-162 ~]# mysqlbinlog --raw --read-from-remote-server -h10.186.61.162 -urepl -pxxx -P3306 --result-file=/data/mysql/backup/binlog/ mysql-bin.000001 --stop-never --stop-never-slave-server-id=100 &

生成sysbench测试数据,创建4张表,每张各100W数据库并压测一分钟模拟数据变化

## 插入基础数据

[root@10-186-61-162 ~]# sysbench /usr/local/share/sysbench/oltp_read_write.lua --db-ps-mode=disable --mysql-host=127.0.0.1 --mysql-port=3306 --mysql-user=sysbench --mysql-password=xxx --mysql-db=sbtest --tables=4 --table-size=1000000 --report-interval=1 --time=600 --threads=20 prepare

## 执行sysbench压测模拟数据变化,压测1分钟

[root@10-186-61-162 ~]# sysbench /usr/local/share/sysbench/oltp_read_write.lua --db-ps-mode=disable --mysql-host=127.0.0.1 --mysql-port=3306 --mysql-user=sysbench --mysql-password=xxx --mysql-db=sbtest --tables=4 --table-size=1000000 --report-interval=1 --time=60 --threads=20 run

执行物理备份模拟每天的全量备份

[root@10-186-61-162 ~]# innobackupex --host=10.186.61.162 --port=3306 --user=backup --password=xxx /data/mysql/backup/

继续执行压测,模拟备份后的数据变化,压测10分钟,模拟大量binlog

[root@10-186-61-162 ~]# sysbench /usr/local/share/sysbench/oltp_read_write.lua --db-ps-mode=disable --mysql-host=127.0.0.1 --mysql-port=3306 --mysql-user=sysbench --mysql-password=xxx --mysql-db=sbtest --tables=4 --table-size=1000000 --report-interval=1 --time=600 --threads=20 run

停止并删除数据库数据库模拟误操作或硬件故障

[root@10-186-61-162 ~]# systemctl stop mysql_3306

[root@10-186-61-162 ~]# rm -rf /data/mysql/data/*

2.2 数据恢复

还原xtrabackup全量备份

[root@10-186-61-162 ~]# cd /data/mysql/backup

[root@10-186-61-162 backup]# innobackupex --apply-log 2020-03-02_17-39-07/

[root@10-186-61-162 backup]# innobackupex --defaults-file=/etc/my.cnf --copy-back 2020-03-02_17-39-07/

将binlog转换为relay log并拷贝到数据目录以便SQL线程回放数据

[root@10-186-61-162 backup]# cd /data/mysql/backup/binlog/

## 将binlog重命名为relay log

[root@10-186-61-162 binlog]# rename mysql-bin mysql-relay mysql-bin*

## 创建relay log index文件

[root@10-186-61-162 binlog]# ls ./mysql-relay.0000* >mysql-relay.index

## 拷贝relay log到数据目录

[root@10-186-61-162 binlog]# cp mysql-relay.* /data/mysql/data/

## 修改数据目录权限

[root@10-186-61-162 binlog]# chown -R mysql:mysql /data/mysql/data/

修改relay_log_recovery参数,设置为0并启动数据库,relay_log_recovery为1时,relay log会在复制线程启动时被清除重新拉

## 获取备份文件中的binlog位点信息及GTID点对应的relay log文件

[root@10-186-61-162 ~]# cd /data/mysql/backup/2020-03-02_17-39-07/

[root@10-186-61-162 2020-03-02_17-39-07]# cat xtrabackup_binlog_info

mysql-bin.00000780456866f41abe78-5c62-11ea-abf1-02000aba3da2:1-52013

## 启动数据库

[root@10-186-61-162 2020-03-02_17-39-07]# systemctl start mysql_3306

## change master指定一个空的主库,创建SQL线程

root@localhost[(none)]> reset master;

## 指定备份文件中对应的binlog位点

root@localhost[(none)]> CHANGE MASTER TO MASTER_HOST='1.1.1.1',RELAY_LOG_FILE='mysql-relay.000007',RELAY_LOG_POS=80456866;

## 查看指定的位点是否生效

root@localhost[(none)]> select * from mysql.slave_relay_log_info;

+-----------------+----------------------+---------------+-----------------+----------------+-----------+-------------------+----+--------------+

| Number_of_lines | Relay_log_name | Relay_log_pos | Master_log_name | Master_log_pos | Sql_delay | Number_of_workers | Id | Channel_name |

+-----------------+----------------------+---------------+-----------------+----------------+-----------+-------------------+----+--------------+

| 7 | ./mysql-relay.000007 | 80456866 | | 0 | 0 | 0 | 1 | |

+-----------------+----------------------+---------------+-----------------+----------------+-----------+-------------------+----+--------------+

## 只需要开启SQL线程对指定的relay log开始回放即可

root@localhost[(none)]> START SLAVE SQL_THREAD;

## 持续执行可看到binlog数据开始回放

root@localhost[(none)]> show slave status\G

## 待binlog恢复完成且数据校验无问题后后可将复制关系重置

root@localhost[(none)]> stop slave;

root@localhost[(none)]> reset slave;

root@localhost[(none)]> reset slave all;

2.3 只恢复单个库的数据

由于备份是全量备份,无法单库还原(如果已知表结构可使用可传输表空间方式单库还原),可先将全量恢复后对只对单库做binlog还原

只需在2.2数据恢复的基础上增加一条以下命令即可实现对sbtest单库的binlog还原

CHANGE REPLICATION FILTER REPLICATE_WILD_DO_TABLE = ('sbtest.%');

2.4 只恢复单个表的数据

该步骤与单库还原类似,只需将复制过滤属性指定为具体的表,如

CHANGE REPLICATION FILTER REPLICATE_WILD_DO_TABLE = ('sbtest.sbtest1','sbtest.sbtest2');

可在开启binlog还原前后对sbtest1-4表做checksum,验证是否只有sbtest1和sbtest2做了binlog还原

checksum table sbtest1,sbtest2,sbtest3,sbtest4;

2.5 恢复到指定的GTID或position点

该步骤只需在2.2数据恢复的基础上,将START SLAVE SQL_THREAD改为START SLAVE SQL_THREAD UNTIL SQL_BEFORE_GTIDS,如只恢复到GTID=499999

START SLAVE SQL_THREAD UNTIL SQL_BEFORE_GTIDS = 'f41abe78-5c62-11ea-abf1-02000aba3da2:500000;

2.6 提升恢复效率的参数优化

set global sync_binlog=0;

set global innodb_flush_log_at_trx_commit=0;

set global slave_parallel_type=LOGICAL_CLOCK;

set global slave_parallel_workers=8;

关闭binlog

2.7 使用复制线程与使用mysqlbinlog恢复的效率对比

mysqlbinlog

恢复耗时 722s

SQL线程

恢复耗时 151s

2.8 总结

使用SQL线程恢复binlog数据相对比mysqlbinlog有以下优势

只需配置好复制让数据库自动恢复数据即可

可以使用MySQL并行复制特性,提升恢复效率

可以精细化的控制恢复的库表

可以指定恢复到具体的GTID点以及跳过误操作的GTID

2.9 恢复优化

假设一个每天凌晨备份,某天早上8点数据库被误操作drop了业务库,请说明恢复的流程

保持主库当前状态

使用主库的备份恢复一个实例

使用change master to后在启动开启START SLAVE SQL_THREAD UNTIL SQL_BEFORE_GTIDS方式让复制同步数据到drop操作之前

跳过drop操作的gtid

继续同步复制

### 如何排查和解决 MySQL Binlog 延迟问题 #### 排查方法 对于MySQL binlog延迟问题,可以通过多种方式来诊断原因: - **检查Binlog格式**:确认当前使用的`binlog_format`设置。如果发现不是ROW模式,则可能是造成延迟的原因之一。例如,在某些情况下,使用STATEMENT或MIXED模式可能会引入额外开销[^5]。 - **监控主从状态**:利用`SHOW SLAVE STATUS\G;`命令获取详细的复制状态信息,特别是关注以下几个字段: - `Seconds_Behind_Master`: 表示从服务器落后于主服务器的时间差。 - `Last_IO_Error`, `Last_SQL_Error`: 显示最近发生的I/O错误或SQL执行失败的信息。 - **分析性能瓶颈**:通过工具如Percona Monitoring and Management (PMM),或者官方提供的Performance Schema表,深入理解系统的资源消耗情况以及可能存在的热点操作。 - **日志审查**:查看MySQL的日志文件(error log, slow query log),寻找任何异常记录或是长时间运行的查询语句。 #### 解决方案 针对不同的延迟成因采取相应的措施: - **优化大事务处理**:当遇到大型事务提交后引起显著延迟时,考虑调整应用程序逻辑减少单次写入量;也可以尝试增加slave上的并行度以加速回放速度[^3]。 - **启用多线程复制功能**:自MySQL 5.6起支持多线程应用事件,允许配置基于数据库目录树结构划分的工作单元来进行更高效的并发恢复工作[^1]。 ```sql STOP SLAVE; SET GLOBAL slave_parallel_workers = N; /* 设置N为期望的最大并发数 */ START SLAVE; ``` - **改进监听服务架构设计**:如果是由于外部程序读取binlog而导致的延迟,比如采用生产者消费者模型的应用场景下,应评估现有实现能否满足吞吐率需求,并适当扩展队列容量、提高CPU/内存利用率等手段增强其承载能力[^4]。 - **定期清理不必要的二进制日志**:防止磁盘空间不足影响整体表现,可通过设定合理的过期策略自动删除旧版本的数据变更记录。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值