Redis集群节点如果出现故障了，会如何处理呢？

最新推荐文章于 2025-08-17 02:28:39 发布

原创最新推荐文章于 2025-08-17 02:28:39 发布 · 979 阅读

CC 4.0 BY-SA版权

文章标签：

33 篇文章

订阅专栏

24 篇文章

订阅专栏

此外在哨兵故障检测之外还存有节点自检，目的在于确保节点间通信正常，维护集群状态。自检不执行恢复，仅广播状态，标记主观下线(PFAIL)

若故障节点为主节点，集群尝试从主节点的从节点中选取新主节点

会不会存在一个从节点收到了同主节点的两轮选举的投票呢？

不会。从节点会计算选举期，若获取的票不在本轮选举中，则不会进行计数

同一主节点是否可以给多个从节点投票呢？

不可以。

从节点能否知道主节点下线的时候立刻发起投票呢？

从节点必须等待Delay时间后，尝试进行选举。以保证其他主节点知晓该主节点已经下线，并且防止从节点同时启动选举

$delay = 500 milliseconds + random delay between 0 and 500 milliseconds + REPLICA_RANK * 1000 milliseconds$

如果手动配置新主节点或者槽迁移恰好碰上了故障选举，使得同一选举期存在多个主节点，那么该如何处理冲突呢？

NodeID字典序更小的节点将成为唯一的主节点，并递增选举期

加入新节点到集群：在集群中任意客户端执行meet
迁移槽
1. 确定哪些槽需要被迁移到目标节点
2. 获取槽中key
3. 将槽中的key全部迁移到目标节点
4. 向集群所有主节点广播槽（数据）全部迁移到了目标节点