P2P存储系统中集中式与分布式恢复方案的性能分析
1. 引言
随着PC存储容量、带宽和计算资源的增长,分布式对等(P2P)存储系统应运而生。这类系统虽具有可扩展性和经济性,但存在可靠性、保密性和可用性等问题。为确保数据可靠性和可用性,系统会插入冗余数据,但仅依靠冗余机制而不修复丢失的数据是低效的,因为当节点离开系统时,冗余度会降低。因此,P2P存储系统需不断存储额外的冗余数据来补偿数据丢失。
恢复机制主要有集中式和分布式两种,同时可采用积极(eager)和懒惰(lazy)两种修复策略。本文旨在开发和评估数学模型,以表征P2P存储系统的基本性能指标(数据寿命和可用性),具体贡献如下:
- 分析集中式和分布式恢复机制。
- 提出一个通用模型,涵盖积极和懒惰修复策略,以及基于复制和擦除码的系统,并考虑节点的临时和永久断开连接情况。
- 使用实际参数值进行数值研究。
- 提供如何设计P2P存储系统以满足特定要求的指导。
2. 相关工作与背景
分布式存储系统的架构和文件系统相关文献众多,但关于P2P存储系统恢复过程建模的工作较少。部分研究开发了分析模型,以理解文件可用性、寿命与存储数据冗余之间的权衡。其中,有研究对使用复制来保证数据可靠性的存储系统进行分析,但该模型未考虑瞬态断开连接,将恢复过程简化为指数分布,且仅考虑了分布式修复方案。不过,该研究对节点的正常运行时间和停机时间的分析支持了本文“节点参与可由指数分布建模”的假设。
在以往工作中,对P2P存储系统建模时做了一些简化假设,如恢复过程为指数分布。但通过模拟分析发现,在基于擦除码的系统中,这一假设通常不成立。因此,本文将放宽这一假设,以实现更精确、更
超级会员免费看
订阅专栏 解锁全文
26

被折叠的 条评论
为什么被折叠?



