微服务故障根因分析与可信执行环境认证机制解析
微服务故障根因分析
在多服务应用中,识别故障的可能根因是一个重要的问题,已经有多种技术被提出。
现有根因分析技术
- 基于分布式跟踪的技术 :
- Zhou 等人和 Guo 等人的方法 :通过手动检查应用的分布式跟踪,并借助可视化工具,系统地识别应用前端故障的根因。他们的方法不仅能找出可能的根因故障,还能确定故障传播到前端的级联情况。但与我们的技术不同,我们能识别应用中任何服务故障的可能根因,且实现了根因分析的完全自动化。
- CloudDiag、TraceAnomaly、MonitorRank 和 MicroHECL :这些都是基于分布式跟踪的根因分析技术,且实现了分析的自动化。CloudDiag 和 TraceAnomaly 直接分析分布式跟踪,将响应时间异常的服务视为故障的可能根因;MonitorRank 和 MicroHECL 则处理分布式跟踪以获得表示服务及其交互的图,并根据服务性能的相关性来访问图,将访问停止的节点对应的服务视为可能的根因。这些技术大多聚焦于分析应用前端故障的可能根因,且需要应用具备分布式跟踪功能,同时它们只返回故障的可能根因,不解释故障是如何传播并导致观察到的故障的。
- 基于监控关键性能指标(KPIs)的技术 :
- ϵ - diagnosis、PAL、Wang 等人和 FChain
超级会员免费看
订阅专栏 解锁全文
1139

被折叠的 条评论
为什么被折叠?



