Raft论文里算法部分核心内容就三个方面:
1、Leader Election 领导者选举
2、Log Replication 日志复制
3、Safety 安全性
前面的系列文章,我们介绍了Ratis里对于第一和第二点的实现。
今天我们就来复习一下Raft论文里关于Safety的描述、案例、规则,并且结合Ratis的代码来分析。
一、Raft论文Safety相关章节回顾
论文里提到,仅有选主+日志复制机制并不能保证每个节点的状态机会严格按照相同的顺序apply日志。
例如,以下场景:
1、Leader 将一些日志复制到了大多数节点上(majority nodes),进行 commit 后leader宕机。
2、某个 follower 并没有被复制这些日志,但它参与选举并当选了下一任 leader。
3、这个新的 leader 又同步并 commit 了一些日志,这些日志覆盖掉了其它节点上的上一任leader已经commit的日志。
4、各个节点的状态机可能 apply 了不同的日志序列,出现了不一致的情况。
因此,需要对选主+日志复制做一些额外的限制,来保证Raft算法的正确性。 在论文里这部分限制也叫Safety安全性。
这里直接先给出两条safety限制规则: