深入了解RapidIO互连技术及其硬件开发
1. RapidIO互连技术的系统应用
在系统中,当接收到端口写入操作时,系统主机负责以可控的方式将插入的现场可更换单元(FRU)引入系统。在清除所有可能的错误条件后,系统主机可以使用维护操作与插入的FRU进行通信。这一过程确保系统主机能够安全地访问插入的FRU,避免受到其不当行为的影响。
为了实现容错系统的前三个基本要素,后三个要素的坚实基础至关重要。互连标准的特性在实现容错任务中起着关键作用,它可能使任务变得容易,也可能几乎无法完成。其中一个关键特性是支持现场可更换单元的热插拔。
1.1 故障恢复支持
故障恢复要求系统能够在几乎不中断应用程序的情况下,从故障硬件切换到正常硬件。它还代表着在事务级别上承受瞬态故障的能力。故障恢复能力完全依赖于满足其他容错要素的能力。如果不满足这些要素,故障控制硬件就无法做出正确的纠正决策。
1.2 100%故障检测
确定硬件故障或事务丢失,100%故障检测是必不可少的。系统中不能有数据报传输数据,这意味着所有数据路径、事务和存储元素都需要通过奇偶校验或某种错误检测代码(如CRC)进行保护。这种检测机制需要在错误发生时能够向控制实体报告错误,并且不能依赖于可能本身就有故障的传输机制。
故障事务需要能够追溯到有问题的事务。如果异常报告不准确,恢复几乎是不可能的,唯一的解决办法可能是系统重置,这将导致系统在重启期间停机。
RapidIO提供了丰富的故障检测机制:
- 所有事务都由CRC代码保护。
- 所有握手控制符号由5位CRC保护,或者传输两次。
- 所有事务必须进行正向握手并严格排序
RapidIO互连技术与容错开发解析
超级会员免费看
订阅专栏 解锁全文

3480

被折叠的 条评论
为什么被折叠?



