可重构嵌入式系统硬件可靠性的进展
1. 应用可靠性要求与系统挑战
应用的可靠性要求规定了其错误概率的上限,系统的可靠性取决于其组件的可靠性。通常假定处理器核心是可靠的计算基础,若加速功能(AF)的加速器未受软错误影响,那么该AF在执行期间无错误。以软件例程执行的AF被视为可靠的。
在可重构架构上执行的AF,其可靠性取决于以下因素:
- 当前错误率 :由环境决定。
- 系统状态 :对应自某区域上次经测试、重新配置或清理后已知无错误的时间。
- 硬件使用情况 :取决于实现AF的加速器所需的关键位数。
为保证给定的目标可靠性并优化性能,运行时系统需应对以下挑战:
1. 若为AF指定了目标可靠性,在该AF执行时,需确保其在当前错误率和系统状态下满足该目标。若此时无法满足目标可靠性,则AF需在可靠计算基础上执行。
2. 若为应用本身指定了目标可靠性,需将其分解为各个AF的适当目标可靠性。
3. 对于所有要执行的AF,需决定应重新配置哪种实现变体,以确保目标可靠性,同时在监测到的错误率和系统状态下最大化性能。
4. 对于每个区域,需决定何时以及多久进行一次清理操作。清理后,加速器被认为无错误,但清理也会降低性能,因为在清理期间无法重新配置其他区域。
2. 加速功能(AF)的可靠性
AF的可靠性取决于单粒子翻转率(SER)、所用加速器的类型、结构和大小,以及加速器在可重构架构中无错误实例化的驻留时间,即自该区域上次重新配置或清理事件以来所经过的时间。具有n个关键位且驻留