监控日志与指标:从错误处理到可视化展示
1. 错误处理与日志记录策略
1.1 错误复现与修复
当在单元测试中复现错误后,修复工作往往较为简单。可以添加一个单元测试来捕获触发错误的条件集,然后进行修复。新的单元测试将在每次自动构建时检测错误是否再次引入。例如,若要修复示例代码,只需移除引发错误的代码行,程序即可恢复正常运行。
不过,有时问题可能源于外部因素而无法解决。比如数据库中的某些行存在问题,或者其他服务返回的数据格式不正确。在这些情况下,虽然无法完全消除错误的根本原因,但可以捕获问题、进行补救,将意外错误转化为预期错误。
需要注意的是,并非每个检测到的意外错误都值得花费时间去处理。有些未捕获的错误能提供足够的问题信息,但超出了 Web 服务的处理范围,例如网络问题导致 Web 服务无法连接到数据库。在决定是否投入时间进行开发时,需自行判断。
1.2 日志记录策略
在处理日志时,一个常见问题是如何为特定消息选择合适的日志级别,是 WARNING 、 ERROR 还是 INFO 呢?大多数日志级别描述使用的定义较为模糊,如“程序显示潜在有害情况”或“程序突出请求进度”,在实际环境中实用性不强。相反,可以通过将每个日志级别与预期的后续操作相关联来进行定义,这样能明确发现特定级别日志时应采取的措施。
| 日志级别 | 应采取的行动 | 注释 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



