mysql主从同步和主从延迟

最新推荐文章于 2024-12-07 12:09:15 发布

原创最新推荐文章于 2024-12-07 12:09:15 发布 · 186 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文深入探讨MySQL主从复制机制，解析异步单线程复制原理，分析主从延迟产生的原因及影响，提供监控和优化策略，适用于高并发场景下的数据库压力缓解。

1. 背景

当前 wiki 的重点：

监控：MySQL 的主从延迟？
影响：
1. MySQL 主从延迟的影响？
2. 多少的延迟，可以接受？
原因：MySQL 主从延迟的产生原因？

2. MySQL 主从复制

2.1. MySQL 主从集群

MySQL 主从集群的作用，要解决什么问题？

场景：

高并发情况下，单台 MySQL 数据库承载的连接数多、读写压力大，MySQL系统瓶颈凸显
大部分互联网场景，数据模型「一写多度」
- 读次数（read_num）一般是写次数（write_num）的 10 倍以上
- 补充：数据分析、商业智能等场景，read_num 和 write_num 基本相当，同一量级

MySQL 集群方式，能够分散单个节点的访问压力，MySQL 集群，常见方式：主从集群

Master 节点，负责所有的「写请求」
Slave 节点，负责大部分的「读请求」

通过 MySQL 主从集群，提升整个系统的可用性，降低访问量大引发的故障率。

常见的主从架构：

一主一从：一个 Master，一个 Slave
一主多从：一个 Master，多个 Slave

具体，参考下图：

2.2. 主从复制原理

MySQL 在主从同步时，其底层实现细节又是什么？为此后分析主从延迟原因以及优化方案，做好理论准备。

总结来说，MySQL 的主从复制：异步单线程。

Master上 1 个IO线程，负责向Slave传输binary log（binlog）
Slave上 2 个线程：IO 线程和执行SQL的线程，其中：
1. IO线程：将获取的日志信息，追加到relay log上；
2. 执行SQL的线程：检测到relay log中内容有更新，则在Slave上执行sql；

特别说明：MySQL 5.6.3 开始支持「多线程的主从复制」，一个数据库一个线程，多个数据库可多个线程。

完整的 Master & Slave 之间主从复制过程：

上述过程：

主从延迟：「步骤2」开始，到「步骤7」执行结束。
步骤 2：存储引擎处理，时间极短
步骤 3：文件更新通知，磁盘读取延迟
步骤 4：Bin Log 文件更新的传输延迟，单线程
步骤 5：磁盘写入延迟
步骤 6：文件更新通知，磁盘读取延迟
步骤 7：SQL 执行时长

通过上面分析，MySQL 主从复制是典型的生产者-消费者模型：整体耗时，分为几类

磁盘的读写耗时：步骤 3、步骤 5、步骤6
网络传输耗时：步骤 4
SQL 执行耗时：步骤 7
排队耗时：步骤 3（生产者-消费者）

2.3. 客观认识：主从架构

Master 数据写入后， Slave 一定要及时写入数据，这个本质是：主从架构下的强一致性。

Master 与 Slave 之间的延迟，是客观存在的。

一般对主从架构的定位：

提升系统的可用行：Master 宕机后，数据不丢失，可以使用 Slave 临时替换 Master
不要求 Slave 跟 Master 的强一致，而只要求最终一致

通常，对数据一致性要求很高的场景下，并不建议采用：主从结构，分担高并发访问压力。

2.3.1. 同步复制

如果要满足主从架构的强一致性，采取「同步复制」的 2PC 策略即可：

第一阶段：Master 收到 Client 的写入数据请求，在本地写入数据；
第二阶段：Master 收到 Slave 写入成功的消息，再向 Client返回数据写入成功；

主流数据库均支持这种完全的同步模式，MySQL的Semi-sync功能（从MySQL 5.6开始官方支持），就是基于这种原理。

「同步复制」对数据库的写性能影响很大，适用场景：

银行等严格要求强一致性的应用，对于写入延迟一般没什么要求（延迟几个小时都可以接受，数据不出错就行）。

2.3.2. 异步复制

异步复制：Master 数据写入成功后，Slave 上异步进行数据写入，只要保证数据最终一致性即可。

3. 主从延迟

3.1. 如何监控

监控主从延迟的方法有多种：

Slave 使用本机当前时间，跟 Master 上 binlog 的时间戳比较
pt-heartbeat、mt-heartbeat

本质：同一条 SQL，Master 上执行的时间 vs. Slave 上执行的时间。

3.2. 主从延迟的影响

Slave 延迟的影响：

异常情况下， HA 无法切换： HA 软件需要检查数据的一致性，延迟时，主备不一致。（什么意思？）
备库 Hang 会引发备份失败：flush tables with read lock 会 900s 超时（什么含义？）
以 Slave 为基准进行的备份，数据不是最新的，而是延迟的。

简单来说，恶化的主从延迟，将丧失 MySQL 集群带来的优势：

读写分离，降低单机压力，提升系统瓶颈上限，如果延迟恶化，则失效。
主备切换，提升系统可用性，如果延迟恶化（1h以上），则失效。

3.3. 产生原因

常见的主从延迟原因：

Master 上，SQL 执行速度慢：优化索引，提升索引区分度
Master 上，批量 DML 操作：建议延迟至业务低峰期操作
Master 上，大事务，耗时长：优化业务，拆分为小事务
Master 上，多线程写入频繁， Slave 单线程速度跟不上：提升 Slave 硬件性能、借助中间件，改善主从复制的单线程模式

3.4. 如何解决

整体上 2 个策略，齐头并进：

内部解决：减弱主从复制的延迟
外部解决：缓存层，在前端访问和数据库之间，添加缓存，优先从缓存读取，减弱数据库的并发压力，Slave 只作为数据备份，不分担访问流量；

减弱主从延迟，采取措施：

提升 SQL 执行速度：优化索引
优化业务逻辑：通过读取操作，业务逻辑上，减少不必要的 DML
细化事务：将大事务拆为小事务，不必要的地方移除事务
减少批量操作：批量 DML 的耗时较多，减少不必要的批量 DML

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。