CMS垃圾回收和线上Full GC排查

本文深入解析了ConcurrentMarkSweep (CMS) 垃圾回收算法的工作原理,包括其各个阶段的特点与流程,并探讨了在实际部署中遇到的FullGC异常问题及解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景

我们上线Java服务的时候需要对其配置一些JVM参数,如堆空间大小、虚拟机栈大小、垃圾回收算法。对于年轻代和老年代我们可以配置不同的垃圾回收算法。在一些对rt要求很高的场景,服务不能有长时间的卡顿,CMS就可以运用于此场景。

Concurrent Mark Sweep,是一款基于并发、使用标记清除算法的垃圾回收算法,只针对老年代进行垃圾回收。CMS收集器工作时,GC工作线程和用户线程可以并发执行,以达到降低STW时间的目的。

开起VM选项-XX:+UseConcMarkSweepGC,表示对老年代的回收采用CMS。

前置知识

STW

首先,我们需要厘清一个概念,即只有标记阶段才需要STW。标记完成以后,需要清除的对象已经确定,无论此时是否产生新的垃圾,都不影响对这些对象的清理。也就是说,清除阶段是可以设计成和用户线程并发执行的。

JVM在暂停的时候,需要选准一个时机,由于JVM系统运行期间的复杂性,不可能做到随时暂停,因此引入了安全点(safepoint)的概念:程序只有在运行到安全点的时候,才可以暂停下来。HotSpot采用主动中断的方式,让执行线程在运行期轮询是否需要暂停的标志,若需要则中断挂起。HotSpot使用了几条短小精炼的汇编指令便可完成安全点轮询以及触发线程中断,因此对系统性能的影响几乎可以忽略不计。

可达性

可达性是指,如果一个对象会被至少一个程序中的可达对象通过直接或间接的方式引用,则称该对象是可达的。更详细地说,一个对象满足一下两个条件之一,即被判定为可达的。

1.本身是根对象。根(root)是指由堆以外空间访问的对象。JVM会将以下对象标记为根:a.虚拟机栈(栈帧中的本地变量表)中引用的对象;b.方法区中的类静态属性引用的对象;c.方法区中的常量引用的对象;d.本地方法栈中JNI的引用对象。

2.被一个可达的对象引用。

CMS的几个阶段

CMS将可达性分析分解成两个阶段:a.仅扫描与根节点直接关联的对象; b.继续向下扫描完所有对象。因此,标记阶段也被拆分成两个阶段,即初始标记并发标记

CMS完整的收集过程如下:

  1. 初始标记(init-mark):仅扫描与根节点直接关联的对象并标记,这个阶段必须STW, 由于跟节点数量有限,所以这个过程非常短暂。
  2. 并发标记(concurrent-marking):与用户线程并发标记。这个阶段在初始标记的基础上继续向下追溯标记。在并发标记阶段,用户线程和标记线程并发执行,所以用户不会感受到停顿。
  3. 并发预清理(concurrent-precleaning):与用户线程并发进行。在并发标记阶段一些对象的引用已经发生了变化,precleaning会发现这些引用关系的改变,并将存活的对象标记。举个例子:如果线程A有一个指向对象X的引用,并将该引用传递给了线程B,CMS需要记录下线程B持有了对象X,即使线程A已经不存在了。precleaning是为了减少下一阶段“重新标记”的工作量,因为remark阶段会STW
  4. 重新标记(remark) remark阶段会STW。如果应用正在并发运行且在不断地改变对象引用,CMS则不能准确地确定某个对象是否存活。所以CMS会在remark阶段STW,从而获取所有引用关系的改变。
  5. 并发清理(concurrent-sweeping):清理垃圾对象,这个阶段GC线程和用户线程并发执行。
  6. 并发重置(concurrent-reset):重置CMS收集器的数据结构,做好下一次执行GC任务的准备工作。

alt text

线上Full GC分析

线上某服务的老年代配置了CMS,但却在gc.log发现连续Full GC的问题。JVM参数配置如下:

-XX:+UseCMSInitiatingOccupancyOnly
-XX:CMSInitiatingOccupancyFraction=68

参数的意义是:在老年代到68%的时候,会触发一次CMS GC,应该是出现类似如下的日志:

T20:10:37.803+0800: 3246087.559: [CMS-concurrent-mark-start]
T20:10:38.463+0800: 3246088.220: [CMS-concurrent-mark: 0.661/0.661 secs] [Times: user=3.17 sys=0.56, real=0.66 secs]
T20:10:38.463+0800: 3246088.220: [CMS-concurrent-preclean-start]
T20:10:38.552+0800: 3246088.309: [CMS-concurrent-preclean: 0.069/0.089 secs] [Times: user=0.14 sys=0.04, real=0.09 secs]_</span>
T20:10:38.552+0800: 3246088.309: [CMS-concurrent-abortable-preclean-start]

但线上环境的日志却出现如下的情况:

alt text

老年代配置了900M,但却在只使用了50+M的时候触发了Full GC,而且是在短暂的时间内连续触发。

配置了CMS却触发Full GC,有以下几种可能:

  1. 大对象分配时,年轻代不够,直接晋升到老年代,老年代空间也不够,触发 Full GC(老年代还剩800+M,显然不可能)
  2. 内存碎片导致(由于CMS是基于标记清除算法的,所有会导致内存碎片,但通过grep -i "cms" gc.log,JVM尚未触发过CMS回收,所以也不存在内存碎片的说法)
  3. CMS GC失败导致(从gc.log并未找到concurrent mode failure的记录,排除)
  4. jmap -histo(人为执行该命令)

经笔者回忆,在中午快12点的时候确实登录过线上机,执行过jmap -histo:live命令,经验证,手动执行jmap -histo:live,也确实会在gc.log出现触发 Full GC的现象,问题得到验证。

原文链接

https://segmentfault.com/a/11...

### 关于GC排查方法 在Java应用程序中,垃圾回收(Garbage Collection, GC)是一个重要的环节。当遇到GC相关问题时,可以通过以下方式来进行排查: #### 1. **确认GC类型** 需要区分Minor GCFull GC的发生原因及其影响。Minor GC通常发生在新生代内存不足的情况下[^1],而Full GC则可能由年代或永久代/元空间不足引起。 #### 2. **分析GC日志** 启用并解析GC日志是诊断GC问题的关键手段之一。可以设置如下JVM参数以记录详细的GC行为: ```bash -XX:+PrintGCDetails -Xloggc:/path/to/gc.log -verbose:gc ``` 日志文件中的信息可以帮助判断是否存在频繁的GC事件、长时间停顿等问题[^5]。 #### 3. **评估GC频率时长** 如果发现GC时间较长(例如超过1秒),或者GC过于频繁,则表明可能存在潜在性能瓶颈。此时应进一步深入调查具体哪部分导致了这种现象。 #### 4. **选择合适的垃圾收集器** 不同的应用场景适合不同的垃圾回收算法。常见的几种包括Serial Collector、Parallel Collector、CMS(Collector of Concurrent Mark Sweep) G1(Garbage First)[^2]。每种都有其特定优势局限性,在实际应用前需充分测试对比效果后再做决策。 #### 5. **调整堆大小及相关参数** 根据业务负载特点合理规划初始堆容量(-Xms)及最大堆容量(-Xmx),同时考虑Eden区(Survivor Ratio)/Tenured Generation比例等因素的影响[^4]。 #### 6. **检测对象存活周期规律** 利用工具如VisualVM,JConsole 或 MAT(Memory Analyzer Tool) 来观察哪些类型的实例占据大量内存资源,并尝试缩短它们的生命期以便更快释放掉无用数据项[^3]。 --- ### 示例代码展示如何开启GC日志功能 ```java public class EnableGCLogging { public static void main(String[] args){ System.out.println("This is a test program to enable GC logging."); // Simulate memory usage that triggers garbage collection. List<byte[]> list = new ArrayList<>(); while(true){ byte[] b = new byte[10 * 1024]; // Allocate ~10KB each time list.add(b); try{ Thread.sleep(10); // Sleep briefly between allocations }catch(Exception e){} } } } ``` 运行上述程序时加上命令行选项`-XX:+PrintGCDetails -Xloggc:path_to_log_file`, 就能够捕获到完整的GC活动轨迹用于后续审查. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值