目录
什么是假死?什么是脑裂
在分布式集群中,我们都会采取某种机制检测主节点是否有故障,有故障的话会选举出新的主节点。
假死:由于心跳超时(网络原因导致)认为leader已死,但其实leader还活着
脑裂:由于假死发起了新一轮的选举,此时会出现2个leader共存。会出现有的客户端请求老leader,有的客户端请求新leader
造成脑裂问题的原因
1.网络的不可靠性。
2.集群状态监测不能做到100%同步,有时间差
如何解决脑裂问题
1. 半数法人机制(Quorums):这种
分布式集群架构中,当主节点故障检测因网络问题导致假死现象,可能引发脑裂问题,即两个领导节点共存。脑裂产生的原因主要是网络的不可靠性和集群状态监测的时间差。解决脑裂常用的方法包括半数以上节点投票的Quorum机制和增加心跳线冗余。Quorum机制确保多数节点确认新领导者的epoch,防止旧领导者继续服务。
目录
什么是假死?什么是脑裂
在分布式集群中,我们都会采取某种机制检测主节点是否有故障,有故障的话会选举出新的主节点。
假死:由于心跳超时(网络原因导致)认为leader已死,但其实leader还活着
脑裂:由于假死发起了新一轮的选举,此时会出现2个leader共存。会出现有的客户端请求老leader,有的客户端请求新leader
造成脑裂问题的原因
1.网络的不可靠性。
2.集群状态监测不能做到100%同步,有时间差
如何解决脑裂问题
1. 半数法人机制(Quorums):这种
264
838
1828

被折叠的 条评论
为什么被折叠?