线上服务器存在问题学习。
问题现象:
1,top命令查询服务器负载达到2.0-5之间,tomcat的cpu使用率达到104%

问题分析过程:
1),磁盘使用率未超出正常范围

2),内存使用率未超出正常范围还有空闲

3),服务器流量未现明显峰值
4),jvm内存状态未现异常非GC原因

综合初步预估是tomcat有线程一直在运行占用cpu资源
问题引出:如何确定tomcat的100%的cpu使用率到底问题在哪?
问题定位方案:
使用java提供的是jstack线程分析命令对进程里面的线程状态进行分析,先导出线程快照再分析具体是那个线程及对应的类
执行步骤:
第一步:ps -ef|grep tomcat 查询出java/tomcat进程PID(eg:8209)
第二步:ps -aux 查询出该进程是哪个用户启动的(即使ROOT用户可能也导出线程快照失败)
第三步:su tomcat 切换到进程启动用户
第四步:jstack -l 8209 > /usr/local/work/tomcat/8209.stack 导出PID对应的线程信息到文件
第五步:对导出的线程文件下载本地做分析(可以文本打开)
第六步:top -H -p 8209 命令查看对应进程是哪个线程占用CPU过高(eg:8308)

第七步:printf "%x\n" 8308 转换十进制为十六进制 此处为:2074
第八步:在导出的堆栈文件中搜索线程ID等于nid=0x2074的线程,此处即列出了该线程对应的类

第九步:根据线程信息找到对应的类定位问题成功,找到原因:日志队列线程一直处于RUNNABLE状态,一直在while循环判定队列是否为空

本文参考:
https://blog.youkuaiyun.com/lj1314ailj/article/details/73550097
如有问题咨询:936172842
转载于:https://blog.51cto.com/13120271/2334536
本文详细解析了线上服务器中Tomcat CPU使用率达到104%的问题现象与分析过程,通过磁盘、内存、流量及JVM状态排除,最终定位为特定线程持续运行导致。并提供了使用jstack命令导出线程快照,结合top命令定位高CPU占用线程的具体步骤。

被折叠的 条评论
为什么被折叠?



