Paxos作为分布式系统的基石,一直都是CS领域的热门话题,Paxos号称是最难理解的算法。最近几天一直在看Paxos相关资料,发现Paxos算法执行过程很简单,但如何推导出Paxos算法确实令人费解。网上有大量关于Paxos的基本概念、算法描述、推导过程等文章,所以关于Paxos的基本概念就不赘述了,但很多文章都没有说清楚推导过程中一些容易让人疑惑的问题(例如为什么提案要被设计为编号+value?value被选定的条件为什么是半数以上而不是其他?等等),本文将试图描述清楚Paxos的推导过程,并解答一些常见的疑问。
先描述算法流程,Paxos算法分为两个阶段,具体如下:
阶段一:
(a) Proposer选择一个提案编号N,然后向半数以上的Acceptor发送编号为N的Prepare请求。
(b) 如果一个Acceptor收到一个编号为N的Prepare请求,且N大于该Acceptor已经响应过的所有Prepare请求的编号,那么它就会将它已经接受过的编号最大的提案(如果有的话)作为响应反馈给Proposer,同时该Acceptor承诺不再接受任何编号小于N的提案。
阶段二:
(a)如果Proposer收到半数以上Acceptor对其发出的编号为N的Prepare请求的响应,那么它就会发送一个针对[N,V]提案的Accept请求给半数以上的Acceptor。注意:V就是收到的响应中编号最大的提案的value,如果响应中不包含任何提案,那么V就由Proposer自己决定。
(b)如果Acceptor收到一个针对编号为N的提案的Accept请求,只要该Acceptor没有对编号大于N的Prepare请求做出过响应,它就接受该提案
一致性算法需要保证:
- 在被提出的提案中,只有一个提案会被选定
- 即被选中的只能是被提出的提案,如果没有提案被提出,则不会有提案被选中
- 但一个提案被选定(chosen)后,进程应该