一致性
一致性问题是分布式理论中的根本性问题。
解决一致性问题的两种方法,2PC、3PC
满足一致性系统需要:
- agreement(全认同)
- validity(值合法)
- termination(可结束)
面临的问题:
- 消息传递异步无序(asynchronous)
- 节点宕机(fail-stop)
- 节点恢复(fail-recover)
- 网络分化(network partition)
- 拜占庭将军问题(byzantine failure)
强一致性、可用性,在一个收窄的模型中,不可能同时满足(FLP定理)
解决方法
- 2PC(tow phase commit)
phase one
(coordinator)propose —->
<—– vote(participants)
commit(全同意) / abort
如果coordinator宕机,则需要一个角色将participants从block中带出来,新增一个角色coordinator watchdog,协调者备份。要求协调者和参与者记录状态,logging,以便coordinator宕机恢复。
总结:coordinator接收到一次事务请求、发起提议到事务完成,经过2PC协议后增加了2次RTT,带来的时延(latency)增加相对较少。
- 3PC(three phase commit)
相比于2PC, 3PC增加了一个准备提交(prepare to commit)阶段来解决,watchdog 启动前可能会有participants宕机的现象。

lamport论文 - Solved Problem,Unsorlved Problem,and Non-Problems in Concurrency
the history of concurrency
- shared variables
- semaphores
- monitors
- CSP
lamport论文 - The Byzantine Generals Problem
可靠的系统必须能够处理故障节点发送的和其他节点相冲突的信息(谎报军情)
将军之间通过信使沟通,需要达成一个共同的作战信息,但是有些将军可能是卧底或者叛徒。问题是如何找到一个算法,让将军们达成一致。
结论是:如果N >= 3M + 1,那这个问题将可以解决。