堆外内存泄漏排查

问题描述

线上的兜底 job 服务监控显示每天以 1% 的速度内存增长,直到 90% 以上,需要手动重启。防止频繁 gc 甚至 oom。

当前环境

jdk1.8.0_91

g1 垃圾回收器

排查过程

监控内存占用达到 60%,top 命令查看内存占用如下

然后查看 java 堆内存分布情况

查看堆内存占用正常。且远小于实际使用的 4.7g。

dump 堆内存用 mat 查看如下:

进一步确认是堆外内存泄漏。

堆外内存泄漏主要是以下几种原因

1.BIO中ByteBuffer分配的直接内存。-XX:MaxDirectMemorySize控制 主要在jvm非堆区

2.元空间 类信息 Symbotabel常量池 XX:MaxMetaspaceSize控制 主要在jvm非堆区

3.JNI或者JNA程序,直接操纵了本地内存,比如一些加密库、压缩解压等资源未释放。 在jvm外的区域

4. Stringtable 比如String.Intern方法调用 主要在jvm堆内堆区

使用 jdk 自带工具 jcmd 启动项目确认原因  项目启动时添加参数  会随时一定性能损耗

-XX:NativeMemoryTracking=detail  相关说明及用法可以参考 https://cloud.tencent.com/developer/article/1406522

可以看到前后对比

可以很明显看到主要是 Symbol 区 Stringtable 的增长 也就是 String.Intern 的调用。

查看相关代码 涉及到这个调用的是 Jackson 的反序列化为 map 的时候 对 key 做了这个操作,用来减少内存占用空间。

解决方案及总结:

** 这是一个 g1 StringTable::intern 的 bug  **

https://bugs.openjdk.org/browse/JDK-8180048

http://mail.openjdk.java.net/pipermail/hotspot-gc-use/2017-February/002629.html

1. 禁用相关,重启后再进行观察,不再出现相关堆外内存泄漏。

new JsonFactory().disable(JsonFactory.Feature.INTERN_FIELD_NAMES);

2. 升级 JDK 到 192u 需要验证

3. 使用 cms 垃圾回收  需要验证

4. 升级相关 jackson 到 3.x 版本默认关闭  需要验证

排查 Java 堆外内存泄漏可以采用以下方法: ### 1. 监控堆外内存使用情况 使用工具如 VisualVM、YourKit 等,它们可以监控 Java 进程的堆外内存使用情况。在 VisualVM 中,通过安装 VisualGC 插件,可以直观地观察堆外内存的变化趋势。如果堆外内存持续增长而不释放,那么很可能存在内存泄漏。 ### 2. 检查 DirectByteBuffer 的使用 `DirectByteBuffer` 是 Java 中常用的用于分配堆外内存的类。可以通过以下代码来监控 `DirectByteBuffer` 的使用情况: ```java import java.lang.management.ManagementFactory; import java.lang.management.MemoryPoolMXBean; import java.lang.management.MemoryType; public class DirectMemoryMonitor { public static void main(String[] args) { for (MemoryPoolMXBean pool : ManagementFactory.getMemoryPoolMXBeans()) { if (pool.getType() == MemoryType.NON_HEAP && pool.getName().contains("Direct Buffer Memory")) { System.out.println("Direct buffer memory usage: " + pool.getUsage()); } } } } ``` 这段代码会输出 `DirectByteBuffer` 的内存使用情况。如果发现其使用量持续增长,需要检查代码中 `DirectByteBuffer` 的创建和释放逻辑。 ### 3. 分析 Native 方法调用 堆外内存的分配和释放通常涉及 Native 方法调用。可以使用工具如 `gdb`(对于 Linux 系统)或 `WinDbg`(对于 Windows 系统)来分析 Native 方法的调用情况。通过设置断点和查看调用栈,可以找出可能导致内存泄漏的 Native 方法。 ### 4. 检查第三方库的使用 一些第三方库可能会使用堆外内存,并且在使用后没有正确释放。检查项目中使用的所有第三方库,查看其文档是否有关于堆外内存管理的说明,并确保正确使用这些库。 ### 5. 代码审查 仔细审查代码,特别是涉及到堆外内存分配和释放的部分。确保所有分配的堆外内存都有对应的释放操作,并且释放操作在合适的时机执行。例如,在使用 `DirectByteBuffer` 时,要确保在不再使用时调用 `cleaner().clean()` 方法来释放堆外内存。 ### 6. 压力测试 通过压力测试模拟高并发场景,观察堆外内存的使用情况。如果在压力测试过程中堆外内存持续增长,那么很可能存在内存泄漏。可以使用工具如 Apache JMeter 来进行压力测试。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值