故障现象
IT运维中心接收到用户反馈,有个关键业务,近几日早上都会响应很慢,运维人员通过NetInside分析系统,希望进一步分析造成系统慢的原因。
业务架构简述
该业务系统采用典型的代理工作方式,其中一台代理服务器面向互联网,代理服务器后接入3台真实的服务器。
分析过程
使用分析系统概要分析看到,该业务系统在故障时段,存在大量的慢访问现象。在业务的延时分布图中,平均时长也超过了20秒。
通过NetInside单个交易分析功能,进一步分析,查看到大量的访问延时超过了50秒。而造成延时的原因主要是服务器响应时间太高。
通过系统瀑布图再次确认,在一次54.24秒的单个交易中,服务器响应时间超过了50秒,这说明慢响应中,的确是服务器响应时间太高。
为了更为有效的说明该故障原因,从分析系统下载单个交易对应的原始报文数据。使用协议解码器工具

运维人员通过NetInside分析系统发现,一个关键业务在早晨响应慢,原因是服务器响应时间过高,而非网络问题。通过详细交易分析和协议解码,定位到故障源头,即负载均衡后的一台服务器性能问题。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



