虽然TTE交换机采用集中守护和COM/MON机制能够抑制故障和错误在设备间传播,但在具体应用时还存在两个问题:一是端到端交换路径上仍可能存在多处单点故障;二是交换机故障抑制可能会造成数据帧丢失。因此在对容错具有较高要求的应用场景中,除了集中守护和COM/MON机制外,TTE还会使用多交换平面冗余的容错设计。
1、多交换平面冗余机制
采用集中守护和COM/MON机制的TTE端到端交换路径如图 1所示。其中交换机中每个接口的“G”代表集中守护逻辑,“C/M”代表COM/MON判决逻辑。从故障产生位置分析,端到端路径上的故障可以划分为5个区域(Fa—Fe)。
Fa故障主要原因是发送端网卡与交换机交换芯片之间的传输链路故障,Fb为芯片引脚到内部逻辑之间的走线故障,Fc为芯片内部逻辑故障,Fd为芯片内部逻辑到输出引脚故障,Fe为交换机交换芯片到接收端网卡之间的传输链路故障。
显然,集中守护逻辑G可以阻断由网卡故障、Fa和Fb故障产生的错误分组,C/M逻辑可以避免Fc产生的故障发送,TTE网卡接收校验可以避免Fd和Fe产生的故障帧进入网卡。
