线上服务器内存不断飙升定位

最新推荐文章于 2024-10-29 11:48:37 发布

二缺和傻宝宝

最新推荐文章于 2024-10-29 11:48:37 发布

阅读量1.3k

点赞数

分类专栏： jvm系列文章文章标签： jvm调优

本文链接：https://blog.youkuaiyun.com/buyaoshuohua1/article/details/120498479

版权

前言

线上服务应用，4核8G的配置，在之前没有配置GC参数的时候，默认是jdk8的并发垃圾回收(JDK8中默认使用组合是: Parallel Scavenge GC 、ParallelOld GC),堆的分配参数也不太合理，这里就不细说了，导致重启后两三天，内存就超过80%，就会收到报警，不胜其烦。

优化历程

第一次优化：

先优化jvm参数配置，可以参考如下网址，在上边填写好服务器信息和日志的路径后，就能生成JVM参数，可以一用；🔗：https://account.heapdump.cn/

配置如下：

-Xmx5440M -Xms5440M -XX:MaxMetaspaceSize=512M -XX:MetaspaceSize=512M -XX:+UseG1GC -XX:MaxGCPauseMillis=100 -XX:+ParallelRefProcEnabled -XX:ErrorFile=/data/logs/hs_err_pidp.log -Xloggc:/data/logs/gc.log -XX:HeapDumpPath=/data/logs -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+HeapDumpOnOutOfMemoryError"

重启后，比之前好了一些，之前三天有的机器内存超过80%，现在基本上一个多星期才超过，也算是比之前强一些，继续吧，内存不断增加，肯定是有泄露呗；

第二次定位优化：

该过程主要分三个操作

检查服务线程，会不会有死锁情况
使用工具分析内存快照，定位内存泄露原因
gc的日志只是有助于观察系统的吞吐量和垃圾回收时间，可以根据报告进行参数的细化调优，但这个相对于前边两项不是重点，还是要优先定位系统代码问题

首先针对第一步

先通过JPS查看进程pid
使用命令

jstack -l 16494 > data/logs/jstack.log

dump当前线程快照信息，进行分析，比如这个是我当时执行后的文件，我复制一部分看下问题情况:
在这里插入图片描述
不知道大家看到这里有没有发现问题，一个服务的线程池竟然有20多个，并且每个里边的初始化线程数都是20，相当于空闲时候还有400多个线程在等待任务处理，可以参考MyBlockingQueueForCondition代码，在最后。

java.lang.Thread.State: WAITING (parking)
	at sun.misc.Unsafe.park(Native Method)
	- parking to wait for  <0x0000000672429938> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
	at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2039)
	at java.util.concurrent.ArrayBlockingQueue.take(ArrayBlockingQueue.java:403)
	at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1067)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1127)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
	at java.lang.Thread.run(Thread.java:745)