提升重复数据删除系统恢复性能的研究与实践
1. 离线重复数据删除备份系统
传统的一级和二级重复数据删除系统可分为在线和离线两种。在线重复数据删除系统在数据写入磁盘前需要写入路径,需满足实时需求,常处理大量请求,易导致严重系统延迟,极大降低系统性能。而大多数离线系统在空闲时段对之前写入的数据进行重复数据删除,由于空闲时段数据写入操作少,可大幅减少数据写入带来的系统延迟。
受离线系统这一优势启发,我们将离线机制应用于恢复系统的缓存策略,旨在优化恢复性能。
2. 系统架构
2.1 概述
在传统备份系统中,备份流中的数据块顺序与恢复流一致。我们的离线缓存替换策略(OFL)可记录备份过程的数据块顺序,提前计算恢复过程所需数据块的准确信息,利用这些信息进行精确预取,减少数据块碎片化影响,实现最优替换。同时,提前分析恢复缓存的替换顺序,降低额外开销,进一步提升恢复性能。此外,OFL在分析和备份时可自由选择时间窗口,无需像传统重复数据删除系统那样在不同时间窗口执行备份操作。
为评估OFL的有效性,我们实现了一个实际原型。基于离线替换策略的数据恢复系统结构包含以下模块:
1. 访问序列(AS) :系统完成数据备份后生成访问序列文件,记录备份涉及容器的容器ID。
2. 离线缓存替换(OCR) :在系统空闲时段模拟数据恢复过程,为后续实际数据恢复提供可靠的恢复缓存替换策略。
3. 替换容器ID(RCI) :记录OCR找出的容器最优替换序列。
4. 元数据(MD) <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



