一次Storm进程JVM内存一直递增，运行效率越来越慢的问题排查

最新推荐文章于 2025-01-07 20:05:19 发布

原创最新推荐文章于 2025-01-07 20:05:19 发布 · 980 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

大数据专栏收录该内容

1 篇文章

订阅专栏

本文讲述了公司在处理大量报警规则时，通过排查程序瓶颈、JVM内存膨胀和垃圾回收问题，最终发现使用eval导致内存剧增。通过将eval转换为本地缓存的Js函数，成功提升了运行效率和资源利用率。

项目背景：

公司有块报警规则的模型，采用实时流storm处理技术，刚开始在规则数量和数据量小的情况下运行比较正常，但是随着业务量的增加，发现程序的运行效率越来越慢，一开始一条数据的处理时间1Ms，10天后，数据的处理性能变成8Ms，造成数据挤压，而且内存也一直递增，然后就采用传统的方案

增加并发，增加主机资源，基本上解决了数据挤压，但是运行效率越来越慢的问题一直没得到解决

9月份开始公司控运行成本，减少主机资源，主机由8C，32G缩减 8C 16G，然后遇到问题就是内存频繁报警，使用率过高，还出现过一次宕机。就出现了问题排查！

问题1：storm进程随着时间的运行越来越慢

时间1

时间2

时间3:

问题2：JVM内存越来越大

进程内存由3G到6.7G导致主机一直资源报警

问题排查

程序中和第三方交互资源瓶颈，比如redis，mysql等，经分析可以排除
程序中有大对象一直引用，无法释放，导致FullGC引起的分析如下： jmap -dump:format=b,file=/data/heap-32.hprof 10507

jmap -dump:format=b,file=/data/heap-67.hprof 10507

分别导出进程3.2G和6.7G时的堆快照，通过jvisualvm 查看对象大小和线程个数基本上一致，而且查看GC日志，很少有FullGC，基本上排除了FullGC的问题

3.难道是默认的GC回收器有问题？默认-XX:+UseParallelGC,JDK8以后推荐使用G1，可以减少程序的停顿时间，试试 -XX:+UseG1GC -XX:MaxGCPauseMillis=100,效果不明显，继续试试

4.难道是堆外内存，使用堆外内存，一部分是元数据区Metaspace，可通过参数设置，触发fullGC，还有一部分是本地方法区的内存，百度查找-XX:MaxDirectMemorySize=256m不设置也会引起内存递增，加上后也没效果，那继续分析堆快照文件，

这块引起了我的注意，jdk.nashorn.internal.runtime.scriptloaded是什么？？JDK8 引入的java中解析Js的加载器，原来程序中调用了eval,调用了 native方法导致内存增加，并且产生了很多class加载器引起的程序运行原来越慢~，那就下步验证

解决方案：每一条规则都生成一个Js function，然后缓存到本地，把变量以参数传递过去

demo如下：

然后经过包装兼容，上线运行：奇迹版的好了。

上线后的测试结果：

从原来的4毫秒左右降到了0.13毫秒，重点是整体资源利用率减少了50%，吞吐量提高了20倍

先写到这里。完工~

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。