分布式系统中移动代理的控制机制与模型解析
1. 系统与故障模型概述
在分布式计算领域,容错是一个广泛且文献众多的领域。早期,该领域被分割成许多看似无关的子学科,术语和方法各不相同,这阻碍了对简单故障模型的共同理解。不过,现在基本术语至少达成了一致。
2. 系统模型
分布式系统由通过通信网络相互连接的自主节点组成。
- 节点组成 :每个节点包含处理器、私有易失性存储和私有稳定存储。并且每个节点都可以访问一个已知最大漂移率的正确本地硬件时钟,该时钟可用于管理警报,如指示超时。
- 节点特性 :节点之间是松散耦合的,没有共享内存,通过消息传递进行通信。
- 通信网络 :假定通信网络是完全连接的。只要没有网络故障,消息的传递是有序、正确且仅发生一次的。
下面用表格总结系统模型的关键信息:
| 项目 | 详情 |
| — | — |
| 节点组成 | 处理器、私有易失性存储、私有稳定存储、本地硬件时钟 |
| 节点特性 | 松散耦合,无共享内存,消息传递通信 |
| 通信网络 | 完全连接,消息有序、正确、仅传递一次(无故障时) |
3. 故障模型
在实际的分布式系统中,组件出现故障后会被修复或替换,最简单的方式是重启崩溃的系统。因此,我们假设没有永久性故障,所有遇到的故障都是暂时性的,这就是由AGUILERA、CHEN和TOUEG在1998年提出的“崩溃 - 恢复模型”,它是原始崩溃故障的扩展。
根据系统模型,
超级会员免费看
订阅专栏 解锁全文
3768

被折叠的 条评论
为什么被折叠?



