redis篇（三）：redis高可用机制

最新推荐文章于 2025-03-29 14:57:23 发布

林伟杰

最新推荐文章于 2025-03-29 14:57:23 发布

阅读量661

点赞数 1

分类专栏： redis 文章标签： java redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_37682665/article/details/106872070

版权

redis 专栏收录该内容

4 篇文章

订阅专栏

本文探讨了Redis的高可用方案，包括主从复制、哨兵机制及分布式架构策略。详细解析了replication、sentinel的工作原理，以及rediscluster的服务端分片策略，旨在提升Redis的稳定性和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

redis

redis

高可用方案

主从复制（replication）

从节点无法写入数据，只能读取数据

配置主从方式：从节点配置文件中添加slave of ip:port

实现原理：从节点设置了主节点后，通过replication.c#replicationCron方法与master节点建立socket连接，每隔1秒执行一次。连接成功后从节点会创建一个专门处理复制工作的事件处理器，用于命令传播以及接收RDB文件等。

全量数据同步过程：

第一次连接同步，slave向master发送PSYNC（2.8版本后）指令，master node通过bgsave全量复制一份RDB文件传输给slave node，过程超过一定时间会进行超时重试（可配置repl-timeout参数）
slave node收到RDB文件后，会先清除自身的旧的数据，在通过RDB文件加载数据
同步过程中产生的指令会缓存在内存中，等待RDB文件写入slave node后在追加指令
同步结束后，master node会持续将写命令传输给slave node节点

如果磁盘性能低，可通过无磁盘化传输RDB文件，即在内存中创建传输

（配置参数：repl-diskless-sync yes）

增量数据同步过程：与全量不同的是，slave发送的psync指令会带有RUNID（服务器运行的ID）以及OFFSET（偏移量），master节点比对RUNID（第一次同步没有此数据）后进行增量同步。

需要注意，若增量同步数据大于复制积压缓冲区大小，则会进行全量同步

复制缓冲区（replication backlog）：缓存一定时间的写指令，默认大小为1M
注意区分输入输出缓冲区：该缓冲区是用于客户端I/O交互的缓冲区

命令传输过程的延迟：写命令同步给slave节点过程中会有数据不一致的现象

可通过配置repl-disable-tcp-nodelay no

yes：对TCP数据进行包合并（可理解为批量传输）减少发送频率，默认为40ms

no：实时传输，master的写指令马上传输到slave节点，频率和带宽会变高

缺点：

RDB同步时间耗时
单单主从部署会有可用性问题，master节点挂掉需要手动重启

哨兵机制（sentinel）

哨兵节点：特殊的状态的redis服务

客户端通过连接sentinel节点，可获取到当前的master节点信息

哨兵尽量为奇数数量，防止脑裂问题（多个leader节点）

监控原理：master节点一定时间没发送心跳请求给sentinel节点的话，会被标记下线，选举新的slave节点为master节点

标记下线的过程（故障转移）failover：

标记下线（主观下线）：某个sentinel发现master节点超过时间（down-after-miliseconds）没发送心跳请求，该节点被标记为主观下线
询问其他监控节点的判定结果：多数认为下线则标记该节点为客观下线
通过leader选举出执行操作的sentinel节点（raft算法）
- 先发现故障节点的sentinel开始投票
- 超过半数票的节点作为leader
sentinel leader节点通过slave no one和slave of指令重新指定master节点
原先下线的master节点恢复后会变成slave节点

选举新的master节点的指标：

断开连接时长、优先级排序（replica-priority 1）、复制数量（从master同步数据的增量复制数）、进程id（越小越优先）
断开时间过长可能丢失选举权

sentinel的几个超时指标：

failover_start_time：当此选举失败后，与下一次选举之间的间隔时间。默认是当前时间加上1s内的随机毫秒数
failover_state_change_time：故障转移中标记节点状态变更的时间
failover_timeout：故障转移过程的超时时间。默认是3分钟
election_timeout：sentinel选举超时时间，是默认选举超时时间和failover_timeout的最小值。默认是10s

缺点：

主从切换过程中的数据丢失：完整数据保存在master当中，同步给slave过程中，master节点宕机，可能导致slave不是完整数据，slave升级成新的master节点，会导致数据丢失
写节点无法水平扩容，哨兵机制适用在一主多从的部署当中，数据无法分片，分片需要部署多组主从

分布式架构方案

redis分片思路

客户端路由：客户端可以通过取模、类似cluster模式、一致性hash的方式进行分片，在分局key计算路由到哪个机器上面。仿照cluster方式可以将槽位与机器的关系缓存到本地中，如（1，100）路由到第一台机器当中

jedis提供了客户端分片的api，可自定义分片规则

代理服务路由：如Twemproxy和codis，原理类似cluester模式：redis节点分别管理一定的槽位，key值根据CRC32计算后模上槽位的个数，余数对应到槽位对应的节点上，有对应的扩容机制。

缺点：

需要保证proxy的可用性，需要引入zk协调
部分命令不支持

redis cluster：服务端分片策略

客户端不需要关心数据分布在哪个节点上：redis节点会自行转发

数据分布方式：

hash取模根据余数分布到不同redis节点
一致性哈希：总结为哈希环结构，数据归属顺时针方向的redis节点，图中data落入redisA-B之间，顺时针方向就属于redisB，因此data数据落在redisB当中
虚拟槽（redis使用的分布策略）：

计算方式：key进行CRC16计算后%16384得到的slot值，数据落入负责对应范围slot的redis节点当中

槽位的数量不会改变，都是16384个槽位，redis分片规则以及扩容机器可配置修改。

修改方式：

添加机器：redis-cli --cluster add-node ip:port newIp:newPort

分配槽位：redis-cli --cluster reshard ip:port

客户端请求方式：若我们通过客户端去访问数据，在redisA中获取redisB中的数据，那么请求会进行重定向到目标机器当中

主从切换方式：cluster模式中，每个mater节点也可配置slave节点作为主从。当主节点挂掉的时候，切换过程：

slave节点记录currentEpoch+1，广播failover消息给各个master节点
各个master节点判断消息合法性，并发送ack消息给该slave节点
slave收到超过半数节点则成为master，广播通知其他集群节点

cluster模式既有主从，又有类似哨兵的主从切换方式，因此不需要引入哨兵模式

优势：

灵活性：可动态调整负责的slot范围
可扩展性：可进行动态扩容和缩容
高可用性：主从切换以及master集群

缺点：

阻塞时间过长会被判断为failover
主从数据无法保证强一致性

数据倾斜问题：集群部分节点数据量过大

前期业务涉及避免高热度数据集中分布
手动调整slot，将数据分摊到不同redis节点当中

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。