2、考虑启动jar时的内存设置
pod使用jdk版本:openjdk1.8.0_312,内存限定4G,启动jar的内存设置参数如下:
java -server -Xms4G -Xmx4G -jar /opt/segment-service-1.0-SNAPSHOT.jar -XX:+UnlockExperimentalVMOptions -XX:+UseCGroupMemoryLimitForHeap -XX:MaxRAMFraction=1 -Xms2G -Xmx4G -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCCause -XX:+PrintGCApplicationStoppedTime -Xloggc:/data/logs/daa-segment.gc.log --grpc.host=img-seg --grpc.port=60051
根据调查有以下几点可能存在问题:
1)openjdk8在pod中启动jar,环境参数在.jar后面可能会失效。
2)有关内存有多个配置,互相有影响。“-Xms4G -Xmx4G”、“-XX:MaxRAMFraction=1”、"-Xms2G -Xmx4G"
3)MaxRAMFraction=1可能会导致OOM。此参数可以使用容器的所有内存,有些垃圾回收机制,可能峰值超过设置的最大分配内存。建议jdk8_191以后使用MaxRAMPercentage参数
4)openjdk8默认的垃圾回收是ParallelGC,此方式内存分配区域是:Young Generation、Old Generation和Meta Space。Xmx和Xms设置的是堆内存,也就是Young+Old,Meta Space属于非堆内存,默认1G,弹性使用。所以分配内存时会超过Xmx的设置。
综上原因,pod内启动jar内存相关参数修改为:
java -server -XX:+UseG1GC -XX:+UseContainerSupport -XX:MaxRAMPercentage=70.0 -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintHeapAtGC -Xloggc:./daa-segment-gc-%t.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=14 -XX:GCLogFileSize=20M -jar /opt/xxx.jar
说明:
-XX:+UseG1GC :使用G1GC作为垃圾回收的机制
-XX:+UseContainerSupport -XX:MaxRAMPercentage=70.0 :使用70%的容器内存作为JAVA可使用内存大小。G1GC垃圾回收机制某些情况会使用略多于这个限制的内存。70%可根据服务具体情况进行调整,有些服务是java调用python或c++,需要预留其他语言或进程的内存。
-XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=14 -XX:GCLogFileSize=20M : 滚动输出gc日志,最大单文件20M,最多14个文件