大规模存储与软件定义网络的容错方案探索
大规模存储系统的主动容错机制
在大规模存储系统中,主动容错机制对于保障系统的可靠性和性能至关重要。以典型的分布式系统Sheepdog为例,一种主动容错方案通过在磁盘真正发生故障之前迁移即将失效驱动器上的数据,显著提升了存储系统的可靠性。
- 不同迁移策略性能对比 :在对比BLSS(带宽受限存储系统)和MS(多源迁移)时,发现BLSS的读取吞吐量更高,这意味着它能比MS更有效地降低对系统性能的影响。当使用MS而不结合BLSS时,由于更多驱动器参与迁移,写入操作更有可能需要等待迁移进程获取锁,导致MS的写入性能不如BLSS。在后续实验中,均采用BLMS(结合带宽限制的多源迁移),并分配10 MB作为迁移带宽。
- 基于优先级的调度评估 :该系统根据优先级迁移数据,对不同严重程度的驱动器进行差异化处理。通过模拟具有不同严重程度警告的过程,证明了将健康度转换为严重程度级别的方法是合理的。例如,首先触发1级预警,迁移速率约为30 MB/s;90秒后出现2级警报,优先级较低,同时1级驱动器的迁移速率下降;150秒时出现相同严重程度的另一个预警,其迁移速率与前两个相近;210秒时触发4级警报。从210秒到630秒,四个驱动器警报的迁移同时进行,1级驱动器的迁移速率最大,两个2级警告的迁移速率居中,4级驱动器的迁移速率最小。630秒后,由于迁移完成,迁移速率逐渐增加。
- 真实工作负载下的性能表现 :之前的实验使用的是合成工作负载,为了更全面地评估系统,选择了Filebench的三个真实跟踪(文件服务器、Web服务
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



