嵌入式系统的可靠性、安全性与监控机制
1. 运行时错误日志
运行时错误日志在嵌入式系统中扮演着至关重要的角色,它能帮助我们诊断系统问题,提升系统的可靠性。
- 错误日志记录
- 错误日志应涵盖所有有助于问题诊断的信息。要拥有一份包含所有错误代码的主列表,并协调好错误日志的使用,确保不同模块和来源的错误有一致、合理的组织。
- 测试错误日志记录机制是系统测试的重要部分,要保证错误能被正确记录。例如,当历史缓冲区满时,要确保丢弃最旧的错误日志条目,而非最新的。
- 系统重置记录
- 记录系统两次重置之间的运行时间是最具挑战性的信息,因为系统重置会影响错误日志的有效写入。
- 一种解决方法是维护一个非易失性内存位置,在正常运行期间定期写入当前系统运行时间。例如,每小时更新一次该位置,记录系统已运行的小时数。一个16位无符号整数可以记录超过7年的小时数。系统重启时,可创建一个错误日志条目,记录重启事件,包括重启时的整数小时值。
- 重启日志方案通常基于系统运行时的日志记录,并据此推断系统何时崩溃和恢复。
2. 错误日志分析
错误日志分析的复杂程度取决于收集的数据量和细节、获取数据的方式以及发送数据的单元数量。
- 识别故障原因
- 错误日志分析最基本的用途是查看故障单元,确定问题所在。这需要查看捕获的错误日志信息,并以此为线索查找问题。
- 它还能证明软件没有故障,问题可能来自其他来源。通过记录正常运行数据可以加强这一论点。虽然没有错误日志条目不能证明没有软件缺陷,但有了错