纳米计算中缺陷与故障的应对策略
在纳米计算领域,系统的可靠性是一个关键问题。由于纳米级设备存在较高的缺陷和故障概率,因此需要采用多种技术来提高系统的容错能力。本文将介绍几种常见的容错技术,并对它们的优缺点进行分析。
1. 提高系统可靠性的必要性与思路
为了在给定或最小成本下最大化基于纳米级设备的系统可靠性,可能需要结合从设备到应用层等不同抽象级别的技术。例如,如果应用本身能够处理一定程度的数据噪声,那么就不需要极高的硬件可靠性,过度使用冗余技术可能并不划算。
2. 传统容错技术介绍
为了减轻设计中缺陷和故障的影响,人们提出并评估了几种传统技术,以下是详细介绍:
- 三重和N模冗余(TMR和NMR)
- TMR :使用三个相同硬件副本,输入相同,理想情况下无缺陷时输出相同。通过多数表决电路选择最常见的输出。单表决器的TMR实现简单,但会增加电路面积和功耗,降低速度。使用三个表决器可提高系统可靠性,避免表决器成为单点故障。
- NMR :是TMR的推广,使用N个硬件副本(N为奇数),通过多数表决确定输出。相比TMR,NMR能在更多模块出现缺陷或故障时正确计算输出,也可利用冗余表决器降低系统因单个表决器故障而失效的概率。
- 级联NMR :有多种级联方案,如复制TMR - 表决器组合并增加多层表决来提高模块可靠性,但会消耗大量电路资源并增加延迟。另一种方案是将硬件划分为子模块并应用NMR,可更有效地承受错误。
- NAND复用
纳米计算缺陷与故障的容错策略
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



