上周做了在定时任务服务上做了一个缓存预热功能,周五发到了测试环境,周一来发现竟然OOM,原因大概是不能再创建线程之类的。
然后从grafana看了下这几天的内存趋势图,发现果然一直在涨。

开始排查。
如果你的pod启动命令添加了:XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/logs/HeapDump_Gc/${HOSTNAME}.hprof
联系运维把dump文件拉下来,用工具分析。
不幸的事,我进入到该pod并没有生成dump文件,只好换另外一种方式。
换个思路,本地启动,用arthas监控。

本地跑项目,启动arthas抓dump日志,放到jProfiler工具里分析(JDK自带的也可以)。
对比发现,无特殊重大对象。
后来,在pod中执行 top -H -p 进程id 。【查看一个进程创建的线程数】
发现项目进程竟创建了2000多个线程。
怎么排查是什么线程?
也用jProfiler工具。

可以看到,手动GC

最低0.47元/天 解锁文章
653

被折叠的 条评论
为什么被折叠?



