提升重复数据删除系统恢复性能的策略探究
1. 离线重复数据删除备份系统
传统的一级和二级重复数据删除系统可细分为在线和离线两种类型。在线重复数据删除系统在数据写入磁盘前需要写入路径,且需实时响应需求,这使得系统要处理大量请求,容易导致严重的系统延迟,进而极大地降低系统性能。而离线系统大多在空闲时段对之前写入的数据进行重复数据删除操作,由于空闲时段数据写入操作较少,因此可大幅减少数据写入带来的系统延迟。
受离线系统这一优势的启发,我们将离线机制应用于恢复系统的缓存策略中,旨在优化恢复性能。
2. 系统架构
2.1 概述
在传统备份系统中,备份流中的数据块顺序与恢复流中的顺序一致。基于此,我们提出了离线缓存替换策略——OFL。该策略能够记录备份过程中的数据块顺序,并利用此顺序提前计算恢复过程中所需数据块的准确信息,进而实现精确预取,减少数据块碎片化的影响,实现最优替换。此外,OFL还会提前分析恢复缓存的替换顺序,从而降低额外开销,进一步提升恢复性能。而且,与传统重复数据删除系统在不同时间窗口进行备份操作不同,OFL在分析和备份时可自由选择时间窗口。
为评估OFL的有效性,我们实现了一个实际的原型系统。该数据恢复系统主要包含以下模块:
1. 访问序列(AS) :系统完成数据备份后会生成访问序列文件,该文件记录了备份中涉及的容器的容器ID。
2. 离线缓存替换(OCR) :通过一系列离线模拟分析找出容器的最优替换序列,并由替换容器ID(RCI)记录该序列。
3. 替换容器ID(RCI)
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



