纳米计算中的缺陷与故障管理技术
1. 纳米计算可靠性概述
在纳米计算领域,由于器件的特性,系统可能会存在一定的缺陷和故障。为了在给定或最小成本下最大化基于纳米级器件系统的可靠性,可能需要结合从器件到应用层等不同抽象级别的技术。例如,如果应用本身能够处理数据中的一定噪声,那么就不需要极高的硬件可靠性,过度使用冗余技术可能并不划算。
2. 传统容错技术
为了减轻设计中缺陷和故障的影响,人们提出并评估了几种传统技术,以下是详细介绍:
- 三重和 N 模冗余
- 三重模冗余(TMR) :使用三个相同硬件副本,输入相同。若模块无缺陷或故障,输出应相同。假设最多一个模块在运行时有缺陷或故障,通过多数表决电路选择最常见的输出。单表决器的 TMR 技术较易应用于数字逻辑,但会增加电路面积和功耗,降低电路速度。它能容忍单个模块的多次故障,但两个或以上模块出现故障会导致逻辑失败。使用三个表决器可提高系统可靠性,消除表决器作为单点故障的问题。
- N 模冗余(NMR) :是 TMR 的推广,使用 N 个硬件副本(N 为奇数),通过多数表决方案确定输出。与 TMR 相比,NMR 在 ⌊(N/2)⌋ 个模块存在多个缺陷或故障时仍能正确计算输出,也可利用冗余表决器降低系统因单个表决器故障而失败的概率。
- 级联 NMR :有多种实现方式。一种是复制 TMR - 表决器组合并增加多层表决来提高模块可靠性,但会消耗大量电路资源并增加延迟,且随着级联层数增加,表决器的可靠性对系统影响更大。另一种是将硬件划分为子模块并对其
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



