开发者可观测性:生产环境调试新利器
1. 错误与容器位置的关联及开发者仪表盘
在排查错误时,我们常常会思考:错误是否与容器的位置有关?日志和指标包含源机器信息,我们可以利用这些信息来验证问题是否特定于某台机器。
许多公司使用Grafana或类似工具创建了多个仪表盘,涵盖从关键绩效指标(KPI)到系统健康状况的各个方面。不过,这些仪表盘通常是为管理层、DevOps团队、SRE等人员的需求而调整的。开发者需要有自己的仪表盘,展示之前提到的关键数值。这个仪表盘应该成为每次打开新浏览器标签时看到的主页,上面的数字和统计数据应成为团队每个成员关注的核心。团队养成持续关注这些数据、寻找异常和变化的习惯,将改变我们处理错误和编写代码的方式。
2. 可观测性与监控概述
可观测性和监控是庞大的主题,有众多书籍进行了深入探讨。作为开发者,我们无需掌握所有知识就能使用相关工具。我们需要了解应用可能出现故障的情况,并利用这些工具为这些场景做好准备。如果我们有足够的覆盖范围和准备,即使遇到意外情况,也能获取所需的信息。
市场上有很多出色的可观测性和监控工具。虽然工具的选择在某些方面很重要,但使用这些工具的过程往往相似。遗憾的是,大多数工具对开发者来说感觉“格格不入”。开发者习惯了使用集成开发环境(IDE)和代码,而这些工具让我们脱离了熟悉的概念,引入了一种需要转变观念的调试新方法。
3. 开发者可观测性的引入
生产环境是最重要的,我们所做的其他一切都是为生产环境做准备以及解决生产环境中的问题。尽管生产环境至关重要,但我们用于跟踪其中问题的工具相对有限。当提到生产环境中的错误时,人们通常会想到最糟糕的情况——应用崩溃,但
超级会员免费看
订阅专栏 解锁全文
49

被折叠的 条评论
为什么被折叠?



