分布式追踪:提升应用性能的关键之道
1. 可观测性工具的选择
在选择可观测性工具时,我们不应仅仅询问“这是一个好的指标工具吗?”(或者是好的日志工具、好的追踪工具),而应问“这是一个好的可观测性工具吗?”这意味着要接受对这些工具更广泛的定义,尤其是分布式追踪。与指标和日志不同,分布式追踪从一开始就假设我们要观测的是一个分布式系统。任何用于分布式系统的可观测性工具都必须提供应用程序的整体视图,而分布式追踪在应用程序的开发和运行中有着更大的发挥空间。
我们应从更广泛的角度看待追踪,它不仅仅是像谷歌的 Dapper 那样的工具,还应能利用多种信息源,并以对开发者和运维人员及时且经济高效的方式将它们结合起来。例如,利用指标数据来理解应用程序外部可能的原因,或者从追踪中导出指标以向运维人员展示应用程序行为的变化;还可以利用日志数据作为追踪的另一个信息源,并向用户展示特定事件数据以解释发生了什么。
虽然可观测性的三大支柱(指标、日志、追踪)为对现有工具进行分类提供了简单的方法,但突破这种范式为我们解决可观测性问题提供了更多可能性。不同的数据来源,无论是单独使用还是结合使用,都能帮助我们在生产系统中建立因果关系。
2. 提升基线性能
在现代软件应用中,生产成本主要与计算资源和其他基础设施有关,包括在私有数据中心购买和运行服务器的成本,或者从云服务提供商租用服务器的成本。软件的交付方式也会影响用户体验。我们可以利用分布式追踪来降低成本并改善用户体验,尤其关注提升基线性能,即软件在数周、数月或季度内的性能表现。理解基线性能有助于我们有效地规划未来几周或几个月的工程工作,从而最大程度地产生积极影响。
在分析性能数据之前,我们需要先确定如
超级会员免费看
订阅专栏 解锁全文
1236

被折叠的 条评论
为什么被折叠?



