拟阵理论与存储码:界与构造
局部可修复码简介
随着对大规模数据存储需求的持续增长,分布式存储系统(DSS)改变了传统的数据存储、保护和访问方式。不过,存储节点故障在大规模 DSS 中频繁出现,这使得修复效率成为一个重要目标。而修复效率的瓶颈在于修复所需联系的节点数量,这可以用“局部性”来衡量。
研究的关键对象是局部可修复码(LRC),简单来说,它是一种存储系统,其中少量故障节点可以由有限数量的其他(相邻)节点恢复。例如,Facebook 和 Windows Azure Storage 等大规模 DSS 已经在使用修复效率高的 LRC。
除了局部性,“可用性”也是一个理想的属性,它表示有多种替代方式来修复节点或访问文件,这对于包含“热点数据”的节点尤为重要。此外,由于故障通常在空间上相关,让每个节点在多个不同规模上都可修复是很有价值的,这就是存储系统中的“层次性”概念。
以下是相关参数的含义:
|参数|含义|
| ---- | ---- |
|n|码长|
|k|维度|
|d|全局最小距离|
|r|局部性|
|δ|局部最小距离|
|t|可用性|
从线性码构建分布式存储系统
线性码 C 可用于构建 DSS,C 中的每个坐标代表 DSS 中的一个存储节点,C 中的每个点代表一个存储的数据项。若 C 是域 F 上的码,数据项是字母表 A 中的元素,那么需要满足一定条件,即能形成线性组合 $f_1a_1 + f_2a_2$($f_1,f_2\in F$,$a_1,a_2\in A$),且已知标量 f 时能从 fa 中读出 a。这要求 A 是 F 上的
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



