分布式追踪与可观测性工具解析
1 分布式追踪的数据处理与成本控制
1.1 ETL 工具不适用于分布式追踪
在分布式追踪中,与缓慢或失败的跨度(span)处于同一追踪(trace)中的部分可能会提供有用的上下文。而且,跨度的真正价值可能在追踪解决方案收集它之后的几秒甚至几分钟才会显现。许多 ETL 工具期望每个数据片段能独立处理,或者集合能统一处理,因此不太适合分布式追踪。通用的 ETL 解决方案在权衡不同资源(如网络与存储)时灵活性较差。根据经验,使用通用解决方案进行收集通常比专门为追踪构建的解决方案需要多一个数量级的基础设施资源。
1.2 减少数据量和成本的其他方法
除了采样,还有其他技术可用于减少数据量和成本:
- 收集跨度统计信息 :收集跨度的统计信息是一种强大的方法。例如,给定操作的发生速率、特定标签值的频率或某类跨度的延迟直方图,这些信息通常比单个跨度占用的空间小,却能深入了解应用程序的运行情况。
- 选择性存储追踪信息 :采样追踪后,无需存储每个追踪的所有细节。了解关键路径上的操作及其贡献,或某些有趣标签的存在情况,就可能有很大价值。如果能在持久存储追踪之前提取这些信息并丢弃追踪本身,可显著降低存储成本。
1.3 分布式追踪的优势与注意事项
分布式追踪工具必须尽量减少对应用程序性能的影响。即使在大规模情况下,追踪也可以以对应用程序本身开销很小的方式实现,因此可以安全地在生产环境中使用。在生产环境中使用追踪能更快地发现问题,因为在分布式系统中,许多故障和问题在生产环境之外很难重现。
不
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



