CPU飙升排查步骤

线上服务器CPU飙升,如何定位到Java代码?

 

解决这个问题的关键是要找到Java代码的位置。下面分享一下排查思路,以CentOS为例,总结为4步。

 

第1步,使用top命令找到占用CPU高的进程。

 

第2步,使用ps –mp命令找到进程下占用CPU高的线程ID。

 

第3步,使用printf命令将线程ID转换成十六进制数。

 

第4步,使用jstack命令输出线程运行状态的日志信息。

 

下面详细介绍每一步的操作。

 

第1步,在使用top命令之后,可以看到一个列表,其中包含PID(进程ID)、USER(操作用户)、CPU占用率、内存占用率、TIME+(运行时间)、COMMAND(运行命令)等信息。一般默认按CPU占用率从上到下降序排列,如下图所示。

e8e6ff0f7d8441e8a6739cdad3b179f8.png 

我们找到COMMAND列是java的这一行,说明这个程序就是用Java编写的。然后,用记事本记下这一行的PID,也就是进程ID。

 

第2步,使用ps -mp命令,输出这个PID下面的线程运行情况列表,如下图所示。

bde6a278e56847f38cfb138a144f73cf.png 

在这个列表中包含了几个关键字段,比如CPU占用率、TID(线程ID)、TIME(运行时间)等。在这个列表中找到CPU占用最高的线程,记下TID,也就是线程ID。

 

前面记下的TID是一个十进制数,不能直接使用,需要转化为十六进制数。

 

第3步,使用 printf 命令将TID转换为十六进制数,如下图所示。

5ae87dccfc954f438ac2861a16d33267.png 

这样就得到了真正占用CPU过高的线程ID。

 

 第4步,使用jstack命令输出线程的具体运行日志,如下图所示。

48a2d563a0f34c0295db2877b98deba4.png 

jstack有3个参数,第1个参数是前面记下的 PID,之后加上 grep,紧跟着是转成十六进制数的TID,最后加上 –A和一个数字,这个数字表示输出日志的行数,至此就可以直接打印出具体的异常信息了。

如果日志信息比较多,异常内容比较复杂,则可以把这些异常信息输出到一个 txt文件中,慢慢分析。只需要在 jstack命令的最后追加 txt 文件名就可以了。

jstack PID | grep TID -A60 >> error_log.txt

<think>好的,用户想知道如何排查和定位CPU使用率飙升的原因。首先,我需要回忆相关的知识,并结合提供的引用内容来组织回答。 根据引用[4],排查的第一步是使用top命令找到占用CPU最高的进程。然后查看线程级别的CPU使用情况,可以用top -Hp或者ps命令。接下来,需要将线程ID转换为十六进制,以便在堆栈日志中查找对应的线程。之后,分析堆栈信息,确定线程在做什么,比如是否在执行GC、死循环或者密集计算。 引用[3]提到,系统上线后CPU飙升的问题在面试和实际工作中都很常见,步骤需要具体可行。可能还需要结合JVM的情况,比如引用[2]指出频繁的GC会导致CPU占用过高,所以需要检查GC日志,使用jstat等工具。 引用[1]提到CPU使用率高可能与上下文切换或可运行线程过多有关,而阻塞线程不一定会导致CPU上升。这点需要区分用户态(us)和内核态(sy)的CPU使用情况。如果sy高,可能涉及过多的系统调用或上下文切换。 接下来,用户可能需要分步骤的指导,比如第一步使用top,第二步用线程分析,第三步转换线程ID,第四步分析堆栈。同时,要提到工具如jstack、jstat、Arthas,以及可能的优化方法如代码优化、调整JVM参数等。 需要确保回答结构清晰,符合用户要求的步骤式解决,并引用相关引用内容。同时生成相关问题,比如分析工具、常见原因、与内存问题的区别等。</think>### 如何排查和定位CPU使用率飙升的原因? #### **排查步骤** 1. **确定高CPU进程** 使用 `top` 命令(或 `htop`)查看系统资源占用情况,按 `P` 键按CPU使用率排序,找到占用最高的进程PID[^4]。 ```bash top -c ``` 2. **定位高CPU线程** 通过 `top -Hp <PID>` 或 `ps` 命令查看进程中具体线程的CPU占用情况,记录高占用的线程ID(TID)。 ```bash top -Hp <PID> ``` 3. **转换线程ID为十六进制** 将TID转换为十六进制(便于后续日志分析),例如十进制 `12345` 转换为 `0x3039`: ```bash printf "%x\n" <TID> ``` 4. **分析线程堆栈** 使用 `jstack` 导出Java进程的线程堆栈(若为Java应用),或通过 `perf` 等工具捕获系统调用。在堆栈中搜索十六进制TID,定位线程执行的具体代码逻辑。 ```bash jstack <PID> > thread_dump.log ``` 5. **检查GC活动** 若为Java应用,使用 `jstat -gcutil <PID> 1000` 观察垃圾回收频率。频繁Full GC可能因内存泄漏或堆配置不合理导致CPU飙升[^2]。 6. **区分用户态(us)与内核态(sy)** - **用户态(us)高**:代码逻辑问题(如死循环、密集计算)或第三方库资源消耗。 - **内核态(sy)高**:频繁系统调用(如IO操作、锁竞争)或上下文切换[^1]。 可通过 `vmstat 1` 查看上下文切换次数(`cs`列)。 7. **结合性能分析工具** 使用 `Arthas`(Java)、`perf`(Linux)、`Async Profiler` 等工具生成火焰图,直观定位热点函数。 --- #### **常见原因与优化** - **代码问题**:如死循环、未优化的算法(如嵌套循环)、锁竞争。需通过堆栈分析代码逻辑。 - **GC频繁**:调整JVM堆大小(`-Xmx`)、选择低停顿垃圾回收器(如G1)。 - **线程数过多**:减少不必要的线程池配置,避免上下文切换开销。 - **外部依赖瓶颈**:如数据库慢查询、网络IO阻塞,需结合日志与链路追踪排查。 --- ###
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值