分布式终止检测算法详解
1. 分布式终止检测问题概述
在分布式系统中,准确检测计算是否终止是一个关键问题。我们首先定义一些重要的谓词来描述分布式计算的终止状态。设 $state_i^{\tau}$ 和 $empty_{(i,j)}^{\tau}$ 分别表示时间 $\tau$ 时进程 $i$ 的状态和通道 $(i,j)$ 的状态。对于分布式执行 $C$,定义谓词 $TERM(C,\tau)$ 如下:
$TERM(C,\tau) \equiv (\forall i: state_i^{\tau} = passive) \land (\forall i,j: empty_{(i,j)}^{\tau})$
这个谓词表明在时间 $\tau$ 时,分布式计算 $C$ 已经终止。而谓词 $TERM(C)$ 定义为:
$TERM(C) \equiv (\exists \tau: TERM(C,\tau))$
可以证明,$TERM(C)$ 是一个稳定属性。假设 $TERM(C,\tau)$ 成立,对于 $\tau’ \geq \tau$,由于在时间 $\tau$ 时没有进程处于活动状态且所有通道为空,根据进程行为规则,没有进程会因接收消息而重新激活。又因为只有活动进程才能发送消息,所以在 $\tau$ 之后不会有新消息发送,即 $TERM(C,\tau) \Rightarrow TERM(C,\tau’)$。
分布式终止检测问题就是设计一个算法 $A$,使其满足以下两个属性:
- 安全性(Safety) :如果在时间 $\tau$ 算法 $A$ 声称计算 $C$ 已经终止,那么 $TERM(C,\tau)$ 为真,即计算在某个时间
超级会员免费看
订阅专栏 解锁全文
652

被折叠的 条评论
为什么被折叠?



