体系结构论文(五十六):Hybrid Modular Redundancy: Exploring Modular Redundancy Approaches in RISC-V Multi-Core

Hybrid Modular Redundancy: Exploring Modular Redundancy Approaches in RISC-V Multi-Core Computing Clusters for Reliable Processing in Space
 

一、文章介绍

背景:

太空中的辐射环境会导致电子设备出现单粒子瞬态(SETs)和单粒子翻转(SEUs)等错误。这些错误比地面环境中更为频繁,严重影响系统的可靠性。因此,设计能够容忍这些故障的系统对于保障太空任务的成功至关重要。当前普遍采用的辐射加固设计(RHBD)方法代价高昂,且在性能、功耗和面积(PPA)方面存在较大开销。

为了弥补PPA上的差距,研究人员开始探索新的低开销解决方案。文中介绍的HMR方法通过灵活的模块冗余技术,在性能和可靠性之间提供了一个可调节的平衡点。这种方法不仅适用于处理计算密集型任务,还可以处理安全关键的任务,具有很强的实用性和灵活性。

核心思想与技术:

模块冗余模式:HMR设计允许通过双核锁步(DCLS)和三核锁步(TCLS)模式,动态地对系统中的多个RISC-V内核进行分组和冗余操作。在高性能需求时,内核可以独立运行,而在关键任务部分,则可以通过冗余执行来提高可靠性。

两种故障恢复方法

  1. 软件恢复:这是一种基于软件的恢复方法,在三核模式下需要363个时钟周期来恢复系统。此方法占用0.612 mm²的芯片面积,增加了1.3%的面积开销。
  2. 硬件恢复:相比之下,硬件恢复方法更加快速,仅需要24个时钟周期即可完成恢复,但占用的芯片面积稍大,为0.660 mm²,增加了大约9.4%的面积开销。

动态锁定机制:HMR系统允许动态配置处理器核之间的锁步模式,支持高性能模式和可靠性模式的快速切换。在进入或退出冗余模式时,开销小于400个时钟周期。这使得系统能够在需要时提高可靠性,同时在其他情况下维持高性能。

实现细节:该系统基于RISC-V的多核处理器集群,使用22 nm工艺,最高工作频率为430 MHz。在非冗余模式下可以达到1160 MOPS的性能,而在双核和三核锁步模式下分别达到617和414 MOPS。

贡献:

  • 提出了一个可动态重配置的多核RISC-V集群,支持双核和三核锁步执行,能够同时处理计算密集型和安全关键型任务。
  • 设计了一个快速的硬件恢复方案,使用了错误校正码(ECC)保护的状态寄存器来加速恢复过程。
  • 提出了一个新的运行时可编程的分离锁定机制,允许在性能和可靠性模式之间进行快速切换。

通过22 nm工艺实现的RISC-V集群,展示了在非冗余和冗余模式下的高性能表现,并且在仅增加少量面积开销的前提下,提供了快速的故障恢复能力。这种灵活的可配置性使得该系统成为第一个结合性能与可靠性平衡的开源RISC-V多核集群。

二、相关工作

1. 设计趋势概述:

随着太空任务对性能要求的提升,传统的依赖辐射加固技术(Rad-Hard)的设计已经不足以满足新的需求。这些传统技术往往成本高、性能低,虽然在关键任务中仍然有应用,但在商业技术进步推动下,S-CPS中的多核架构开始获得青睐。

RISC-V被越来越多地应用于定制的系统芯片(SoC)设计中

2. 相关的容错方法:

辐射诱导故障:太空中的辐射环境比地球上更为严苛,会导致单粒子瞬态(SETs)和单粒子翻转(SEUs),这些软错误对电子系统的影响非常大,需要采取专门的措施进行防护。

辐射加固设计:辐射加固技术通常依赖于硅层级的设计改进,比如晶体管尺寸的调整和低级别的电路修改,以增强技术单元对粒子撞击的鲁棒性。然而,这类技术通常昂贵且局限于较旧的工艺节点,难以跟上现代技术的发展。

3. 架构修改的容错方法:

纠错码(ECC):这是最常见的保护静态数据的方法,通常用于存储器和寄存器中,以较低的额外开销提供信息冗余。

模块冗余(Modular Redundancy):如双模块冗余(DMR)和三模块冗余(TMR),这些技术依赖于硬件模块的冗余执行和结果比对。

文中的SHATKI-F等系统结合了ECC和DMR的混合方法,用ECC保护存储器和寄存器,同时在执行单元中使用DMR,以确保正确计算。

4. 系统级容错方法:

双核锁步(DCLS)和三核锁步(TCLS):这种方法在系统级别复制整个处理器核,并在边界处添加检查器和投票器,以实现容错。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

D了一天bug忘了编译

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值