分布式快照:原理、算法与应用
1. 引言
在分布式系统中,计算是将给定初始状态转换为最终状态的一系列原子动作。在顺序进程中,这些动作是完全有序的,但在分布式系统中,它们只是部分有序。通常,我们会从状态和状态转换的角度来分析程序的属性。
分布式系统的状态(也称为全局状态)是所有组件进程的局部状态以及消息传输通道的状态集合。由于本地物理时钟无法完全同步,全局状态的各个组件无法同时记录。在异步分布式系统中,动作与时间无关,因此关键问题是:何时以及如何记录进程和通道的状态?不同的记录时间会导致全局状态的值有很大差异。
以一个由三个进程(编号为 0、1、2)通过 FIFO 通道连接的系统为例,假设有数量未知的不可区分令牌在网络中无限循环。我们希望进程相互协作,在不停止系统的情况下准确统计系统中循环的令牌数量。这个任务由发起者进程(如进程 0)启动,它会向其他进程发送查询消息以记录它们看到的令牌数量。当只有一个令牌时,可能出现以下情况:
- 可能性 1 :进程 0 收到令牌时记录 n0 = 1。进程 1 记录 n1 时,令牌在通道 (1, 2) 中,所以 n1 = 0。进程 2 记录 n2 时,令牌在通道 (2, 0) 中,所以 n2 = 0。此时,n0 + n1 + n2 = 1。
- 可能性 2 :进程 0 收到令牌时记录 n0 = 1。进程 1 记录 n1 时,令牌已到达进程 1,所以 n1 = 1。进程 2 记录 n2 时,令牌已到达进程 2,所以 n2 = 1。此时,n0 + n1 + n2 = 3,但由于令牌不可区分,没有进程知道同一个令牌被记录了三次。
-
超级会员免费看
订阅专栏 解锁全文
51

被折叠的 条评论
为什么被折叠?



