Linux(2)---记录一次线上服务 CPU 100%的排查过程

Linux(2)—记录一次线上服务 CPU 100%的排查过程

当时产生CPU飙升接近100%的原因是因为项目中的websocket时时断开又重连导致CPU飙升接近100% 。如何排查的呢 是通过日志输出错误信息: 得知websocket时时重新
连接的信息,然后找到原因 解决了。
当然这里幸好能通过日志大致分析出原因 那么我就在思考如果日志没有告诉任何信息 但线上CPU还是接近100%那么如何排查呢。所以学习了下排查过程。
通过查阅资料并实践后,这里总结了两种办法。第一种博客满天飞的方法 通过top命令 第二种非常好用 通过大牛写的脚本排查

一、top命令排查

1、命令四部曲

(1)通过top命令,知道CPU最高的进程

top

(2)具体查看java中哪个线程一直在占用cpu时间(这里我的java进程号是: 8752)

 #java进程ID进行CPU占用排查(sort -rn 以数值的方式进行逆序排列)
 ps -mp 8752 -o THREAD,tid,time | sort -rn | more  

(3)根据2中查找到的CPU最高的排序中的结果,找出几个占用cpu时间比较高的TID,将线程ID转换为16进制

printf "%x\n" TID

(4)再使用jstack命名查询是哪个线程

#8752是java进程ID,6669是第三步线程ID转换的16进制
jstack 8752 |grep 6669 -A 30

2、案例

(1) top命令

(2)ps命令

(3)printf命令

(4)jstack命令


二、show-busy-java-threads.sh脚本

上面的 4 步虽然能够排查问题,但总的还是还是太繁琐耗时了,于是有大神写了个脚本,在有问题的时候一键定位,能够妙计找到问题。这个作者是一个叫淘宝的oldratlee 同学

1、脚本使用说明

怎么使用呢?可以看作者的GitHub地址中的文档说明,而且里面也有相应脚本:Github

我们可以把这个git项目clone到Linux环境中(说明:目前这个脚本只支持linux环境)

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值