Redis 数据同步
全量同步

redis 从节点第一次连接主节点采用的是全量同步,包括两个阶段:
第一阶段:
- 从节点执行slaveof命令和主节点建立了连接,然后发送同步请求;
- 主节点收到消息判断是否是第一次请求,如果是,将数据版本信息发送给从节点;
- 从节点存储存储数据版本信息;
第二阶段:
- 主节点后台 fork 子进程生成 RDB;
- 将生产的 RDB 文件发送给从节点;
- 由于在记录 RDB 的同时会生成指令,主节点将这部分指令存储到repl_baklog;
- 将 repl_baklog 的指令发送到从节点;从节点进行存储;
数据同步原理
全量同步过程有一个问题:主节点如何判断一个从节点是第一次同步数据?
实际上每一个 redis 节点都会有一个 replication id ,称为数据集ID。从节点第一次请求主节点,会带上 replication id,主节点收到从节点 replication id,和自己的 replication id 对比,如果不相同说明是第一次请求同步数据,主节点将自己的 replication id 发送给从节点,从节点存储主节点的 replication id,从节点后续请求再带上该 replication id。
此外,主节点如何知道每次从 repl_baklog 中获取哪部分数据同步从节点?
实际上主节点向从节点同步数据时,会带上两个个参数:replication id 和 offset, offset 标记每次复制数据的偏移量。往后同步从节点带上 replication id 和 offset 即可。


增量同步
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OF5Xs64v-1656605036138)(https://note.youdao.com/yws/res/7/WEBRESOURCEcb63e2e95c849a9c2da7484aeecd9627)]](https://i-blog.csdnimg.cn/blog_migrate/e2d3cd4c178a696bbfd05b2179f81479.png)
增量同步一般发生在重启阶段:
- 从节点带上 replication id 和 offset 向主节点请求同步;
- 主节点根据 replication id 判断是否和自己的一致;如果一直则回复继续;
- 主节点从 repl_baklog 中取出数据,同步到从节点;
- 从节点接收之后存储指令;
增量同步过程中需要注意一个问题:repl_baklog 是一个循环数组,offset 是主节点和从节点同步内容的偏移量。由于 repl_baklog 是一个循环数组,当从节点停止过长时间,旧数据会被新数据覆盖,这时候只能做全量同步。
主从同步优化
可以从这几个方面来优化主从集群:
- 在 master 中配置 repl-diskless-sync yes 启动无磁盘复制,避免全量同步时的磁盘IO;
- Redis 单节点的内存占用不要太大,减少 RDB 导致的过多磁盘IO;
- 适当提高repl_baklog的大小,发现slave宕机时尽快实现故障恢复,尽可能避免全量同步;
- 限制一个 master 的 slave 节点,如果需要较多的 slave,可以采用主-从-从链接模式;

本文详细介绍了Redis的主从数据同步过程,包括全量同步的两个阶段和增量同步的实现。全量同步时,主节点通过fork子进程生成RDB文件并发送给从节点。增量同步依赖于replication id和offset来定位要同步的数据。主从同步优化方面,可以通过启用无磁盘复制、限制主节点的从节点数量等策略来提升效率。

被折叠的 条评论
为什么被折叠?



