CPU利用率是一个时间段内CPU使用情况的统计,使用率占时间段的比率;
Load Average指在一个时间段内使用和在排队的进程数的平均统计。
关于CPU和Load Average解释比较好的一篇转载文章可参见:https://blog.youkuaiyun.com/liwenxia626/article/details/84402891或者作者原文https://www.cnblogs.com/yunxizhujing/p/9382396.html
1)如果CPU占用过高,而Load average比较低,说明一段时间内,某耗CPU的线程正在运行。
a.通过top或者ps -aux找到占用CPU比较高的进程
b.top -p 占用CPU高的进程 -H 找到占用CPU高的线程
c.printf "%x\n"将该线程转换成16进制
d.jstack 进程号|grep 16进制线程号定位到代码
e.根据代码具体分析
2)如果Load过高,而CPU正常,说明等待的进程过多,而占用CPU的线程占着CPU却不工作,考虑是否该线程死循环了
a.ps -aux或者ps -axjf查看各进程的状态STAT
b.linux进程的几种状态,找到睡眠状态D的进程。
附:linux的几种状态(参考自:https://www.cnblogs.com/tekkaman/p/3340271.html)
1. Linux进程状态:R (TASK_RUNNING),可执行状态&运行状态(在run_queue队列里的状态)
2. Linux进程状态:S (TASK_INTERRUPTIBLE),可中断的睡眠状态, 可处理signal
3. Linux进程状态:D (TASK_UNINTERRUPTIBLE),不可中断的睡眠状态, 可处理signal, 有延迟
4. Linux进程状态:T (TASK_STOPPED or TASK_TRACED),暂停状态或跟踪状态, 不可处理signal, 因为根本没有时间片运行代码
5. Linux进程状态:Z (TASK_DEAD - EXIT_ZOMBIE),退出状态,进程成为僵尸进程。不可被kill, 即不响应任务信号, 无法用SIGKILL杀死