Tomcat服务停滞问题分析：内存泄漏导致GC抖动及线程阻塞（内存泄漏导致的渐进式服务退化）

原创已于 2025-07-09 13:45:03 修改 · 893 阅读

CC 4.0 BY-SA版权

文章标签：

于 2023-07-17 16:00:21 首次发布

7 篇文章

订阅专栏

2 篇文章

订阅专栏

通过以下命令检查基础资源占用：

top       # CPU监控（发现异常进程7020）
free -h   # 内存监控
df -hl    # 磁盘监控
PID   USER  %CPU  COMMAND
23328 root  399.6  java

CPU占用近400%+
通过top -Hp 23328定位异常线程：
在这里插入图片描述

## 使用过命令强制输出23328的堆栈信息从而分析出可能出现内存泄露的代码(-F：强制执行，CPU打满的情		   况下一定要强制输出，不然执行很慢甚至可能无法得到执行结果)
jstack -F 23328 > thread_dump_F.txt

JVM内存占用99%
jmap -heap输出显示内存耗尽：

PSYoungGen used 1332687K/1396736K (99%)  // 年轻代
ParOldGen used 5401292K/5401600K (99%)   // 老年代

堆内存快照分析
紧急生成Heap dump：
```
jmap -dump:live,format=b,file=heapdump.hprof 7020
```
- 使用MAT/Eclipse分析发现：
  对象XXXX的实例数异常增多（内存泄漏）
- 泄漏路径：
  XXXX对象 → 被本地缓存强引用 → 无法被GC回收
线程栈分析
jstack -F输出显示：
- Tomcat所有200个工作线程均处于 waiting for monitor entry（锁竞争）
- 线程阻塞原因为：频繁Full GC导致系统卡顿，形成恶性循环：

为什么未触发OOM？

内存泄漏是渐进过程，当泄漏速度 ≈ GC回收速度时：
Full GC持续尝试回收内存（暂停业务线程），但始终无法释放足够空间。
此时系统进入 “卡死”状态：既未崩溃，又无法处理新请求。

JVM参数优化

-XX:+UseG1GC                     // G1收集器更适合大堆
-XX:MaxGCPauseMillis=200         // 控制GC停顿时间
-XX:InitiatingHeapOccupancyPercent=45  // 更早启动并发GC