使用jvisualvm工具进行OOM问题排查和调优。

本文讲述了在Springboot项目中集成activityMQ,实现消息分发到RocketMQ和DataHub时遇到的内存溢出和线程过多问题。通过jvisualvm工具进行排查,发现CPU高、内存无法回收和线程数量激增等问题。经过优化,成功降低CPU占用,解决内存溢出,并控制了线程数量。文章还分享了jvisualvm的其他功能,如查看JVM参数、线程分析和dump文件分析。

1.业务场景介绍:

使用Springboot项目进行activityMQ的接入。把消息分发到另外两个地方:rocketMQ和DataHub。实现数据的传输。并保证数据的一致性。

2.问题介绍

代码写完。运行后。发现没过多久项目就报错。java.lang.OutOfMemoryError: unable to create new native thread

3.问题排查

使用工具jvisualvm进行排查.工具是安装jdk后自带的。

我的Mac路径是在/Library/Java/JavaVirtualMachines/jdk1.8.0_60.jdk/Contents/Home/bin/jvisualvm

找不到可以用find命令进行查询:find / -name jvisualvm

双击启动后的页面如下。

然后找到需要排查的本地项目进程。open it.

从上图可以看到问题有哪些?

a.cpu占用比较高。一直不停的在使用cpu资源。40%到55%左右。

b.使用的内存也很好。jvm回收不过来。

c.线程数量也在不断增加。开始1000多到2000+。这是很不合理的。

4.优化结果

这样我们就可以看到是多线程的问题引起的。经过一两个小时的优化。具体代码不好展示。😄我们来看看优化后的monitor监控情况如何:

 

对比不难看出来。优化的结果还是很棒的。已经达到了我们想要的效果。

a.cpu也不会占用太高。

b.也没有报java.lang.OutOfMemoryError: unable to create new native thread异常了。

c.线程数量也是比较小的数量。稳定在一个水平下。

5.排查工具jvisualvm的其他功能分享

查看jvm 的参数

也可以看线程查问题原因。

当然还可以打heap dump 和Thread dump.用来分析dump文件来定位问题的原因。

最后感谢大家的支持。希望能帮助到大家。。

 

 

<think>我们正在处理一个关于Java OOM(OutOfMemoryError)排查常见类型的问题。用户已经提供了三个引用,但根据指令,我们需要参考上一次的对话历史。回顾历史,上一次我们详细讨论了G1垃圾回收器的工作原理参数。而当前用户的问题是关于OOM排查常见类型。 结合引用用户当前问题,我们需要: 1. 介绍如何排查OOM问题(步骤、工具) 2. 列举常见的OOM类型及其原因 注意:用户提供的引用中,引用[1]提到了排查OOM问题的核心思路(定位内存区域→获取内存快照→分析对象引用→修复代码/配置)工具链(MAT+Arthas+NMT);引用[2][3]则介绍了OOM的常见类型(堆内存溢出、元空间溢出等)。 因此,回答结构可以如下: - 第一部分:排查OOM问题的步骤(结合引用[1]补充知识) - 第二部分:常见的OOM类型(结合引用[2][3]) - 第三部分:相关问题生成 另外,注意系统指令要求:数学公式用$...$,独立公式用$$...$$,代码块用```,引用标识自然添加。 由于回答中会涉及一些具体参数代码示例,需要确保准确性。 具体步骤: 1. 排查步骤: a. 定位内存区域:通过错误日志确定是哪个内存区域溢出(堆、元空间等) b. 获取内存快照:在发生OOM时自动生成dump文件(-XX:+HeapDumpOnOutOfMemoryError) c. 分析对象引用:使用MAT、JVisualVM工具分析dump文件,找出内存占用最大的对象及其引用链 d. 修复问题:根据分析结果修复代码或整配置 2. 常见OOM类型: a. Java heap space:堆内存不足,对象无法分配 b. PermGen space(JDK7及之前) / Metaspace(JDK8+):类元数据区溢出 c. GC overhead limit exceeded:GC开销超过限制(垃圾回收效率低下) d. Unable to create new native thread:线程创建过多,超过系统限制 e. Direct buffer memory:直接内存溢出(NIO使用不当) f. Requested array size exceeds VM limit:数组过大 最后,生成相关问题。 注意:在回答中适当加入引用标记,如[^1][^2][^3]。</think>### Java OOM问题排查指南及常见类型 #### 排查OOM问题的核心步骤 1. **定位内存区域** - 通过错误日志确定OOM类型(如`java.lang.OutOfMemoryError: Java heap space`) - 使用JVM参数`-XX:+HeapDumpOnOutOfMemoryError`自动生成内存快照 - 工具辅助定位: ```bash jcmd <pid> VM.native_memory # 查看内存分布(NMT)[^1] jstat -gcutil <pid> 1000 # 实时监控GC状态 ``` 2. **获取内存快照** - 手动生成Dump文件: ```bash jmap -dump:live,format=b,file=heap.hprof <pid> ``` - Arthas实时诊断: ```bash dashboard -i 2000 # 监控内存/线程 heapdump --live /tmp/dump.hprof ``` 3. **分析对象引用** | **工具** | **核心功能** | **使用场景** | |----------------|---------------------------------------|---------------------------| | Eclipse MAT | 对象直方图/支配树/泄漏报告 | 定位内存泄漏对象[^1] | | VisualVM | 实时堆监控/线程分析 | 快速查看对象分布 | | JProfiler | 内存分配追踪/CPU热点分析 | 复杂场景深度分析 | 4. **修复与预防** - **代码修复**:修复循环引用、关闭未释放资源(如数据库连接) - **配置整**: ```bash -Xmx4g -Xms4g # 增加堆大小 -XX:MaxMetaspaceSize=512m # 限制元空间 -XX:MaxDirectMemorySize=1g # 限制堆外内存 ``` - **监控体系**:Prometheus + Grafana监控`JVM_Memory_Used`等指标 --- ### 常见OOM类型及解决方案 | **OOM类型** | **触发原因** | **解决方案** | |---------------------------------|-----------------------------------------------------------------------------|-----------------------------------------------------------------------------| | **`Java heap space`** | 对象数量超过堆容量<br>- 内存泄漏(如静态集合持续增长)<br>- 大对象分配失败 | 1. MAT分析泄漏对象引用链[^1]<br>2. 增加`-Xmx`<br>3. 化数据结构(避免`HashMap`无限扩容) | | **`Metaspace`**<br>(JDK8+) | 加载类过多(如动态代理滥用)<br>反射/字节码框架过度使用 | 1. `-XX:MaxMetaspaceSize=512m`<br>2. 检查类加载器泄漏<br>3. 减少动态类生成 | | **`GC overhead limit exceeded`**| GC时间超过98%,回收效率低下<br>- 内存碎片化<br>- 对象晋升过快 | 1. 整GC策略(如G1)<br>2. 减少对象存活时间<br>3. 增加`-XX:GCTimeLimit`阈值 | | **`Unable to create native thread`** | 线程数超过系统限制<br>- 线程泄漏(未用`thread.join()`)<br>- `ulimit`配置过低 | 1. `jstack`分析线程栈<br>2. 整`ulimit -u`<br>3. 改用线程池控制并发数 | | **`Direct buffer memory`** | 堆外内存(NIO)耗尽<br>- `ByteBuffer.allocateDirect()`未释放 | 1. 检查`DirectByteBuffer`泄漏<br>2. 显式用`Cleaner.clean()`<br>3. 限制`-XX:MaxDirectMemorySize` | | **`Requested array size exceeds VM limit`** | 申请超大数组<br>- 超过`Integer.MAX_VALUE - 8`限制 | 1. 分块处理数据<br>2. 使用文件映射替代内存数组 | > **关键数据**:生产环境统计显示,约70%的OOM由`Java heap space`引起,其中60%源于内存泄漏[^2]。 --- ### 典型案例分析 **场景**:某服务频繁出现`Metaspace` OOM **排查过程**: 1. 日志显示`java.lang.OutOfMemoryError: Metaspace`[^3] 2. Arthas执行`classloader -t`发现未卸载的Groovy类加载器 3. MAT分析显示动态脚本生成的类未回收 4. 修复:添加类卸载机制 + 设置`-XX:MaxMetaspaceSize=256m` **内存泄漏代码示例**: ```java // 静态Map导致对象无法回收 public class LeakExample { private static Map<Object, Object> cache = new HashMap<>(); public void addToCache(Object key, Object value) { cache.put(key, value); // 对象持续增长直至OOM } } ``` --- ### 预防性监控指标 | **监控项** | **预警阈值** | **工具命令** | |--------------------------|------------------|----------------------------------| | 堆内存使用率 | >85% | `jstat -gcutil <pid>` | | Full GC频率 | >2次/分钟 | `jstat -gc <pid> 1000` | | Metaspace使用量 | >90% | `jcmd <pid> VM.metaspace` | | 线程数 | >最大线程数80% | `jstack <pid> \| grep -c 'java.lang.Thread'` | > 通过`-XX:NativeMemoryTracking=detail`可追踪所有内存区域[^1]。 --- ### 相关问题 1. **如何用MAT分析内存泄漏对象的GC Root路径?** 2. **G1垃圾回收器如何降低OOM风险?参数有哪些?** 3. **堆外内存泄漏的排查工具有哪些?如何定位`DirectByteBuffer`泄漏?** 4. **动态代理导致Metaspace OOM的根本原因是什么?如何避免?** 5. **Arthas的`memory`命令`heapdump`命令在OOM排查中的具体应用场景?**
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JavinLu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值