CMS垃圾回收器解析

原创于 2025-10-08 19:19:16 发布 · 1k 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#jvm #测试工具 #java

编程语言专栏收录该内容

200 篇文章

订阅专栏

一、CMS垃圾回收器简介

CMS（Concurrent Mark-Sweep）是JVM中最早实现并发垃圾回收的收集器之一，主要目标是最小化应用停顿时间，适合对响应延迟敏感的服务端应用（如Web服务器、在线交易系统等）。

适用JVM参数：-XX:+UseConcMarkSweepGC
主要针对老年代进行回收（新生代默认用ParNew）

二、工作原理与生命周期

CMS采用“标记-清除”算法，核心思想是让大部分GC工作与应用线程并发执行，从而减少Stop-The-World（STW）停顿。

1. 回收流程

CMS老年代回收大致分为4个阶段：

初始标记（Initial Mark）
- STW短暂停顿
- 标记所有GC Roots直接可达对象
并发标记（Concurrent Mark）
- 与应用线程并发
- 从GC Roots出发，扫描对象图，标记所有可达对象
重新标记（Remark）
- STW，时间较短
- 处理并发标记期间新产生的引用变动（通过“增量更新”或“原始快照”）
并发清除（Concurrent Sweep）
- 与应用线程并发
- 回收所有未被标记的对象，释放空间

注意： 新生代通常由ParNew（多线程）回收，老年代由CMS回收。

三、算法细节与实现机制

1. 标记-清除算法

标记阶段：遍历对象图，标记所有可达对象。
清除阶段：回收未被标记的对象，空间可能产生碎片。

2. 并发与STW

只有初始标记和重新标记需要STW，时间短。
并发标记、并发清除与应用线程并发，减少应用停顿。

3. 写屏障与卡表

为了支持并发标记，JVM采用写屏障（Write Barrier）机制记录对象引用的变动。
典型实现有“增量更新（Incremental Update）”和“原始快照（Snapshot-at-the-Beginning）”。

4. 空间碎片问题

CMS采用清除而非压缩，容易产生老年代碎片，可能导致“Promotion Failed”或“Full GC”。

四、优缺点分析

优点

低延迟：STW时间短，适合对响应时间敏感的应用。
高并发：大部分GC工作与应用线程并发进行。

缺点

空间碎片：采用标记-清除，老年代易碎片化，严重时触发Full GC。
并发失败：如果回收速度跟不上分配速度，可能“Concurrent Mode Failure”，导致Full GC，长时间STW。
CPU资源消耗大：并发阶段与应用线程争抢CPU，整体吞吐量下降。
已被G1等新一代GC替代：JDK9以后已标记为“即将废弃”。

五、常用JVM参数与调优

1. 启用CMS

-XX:+UseConcMarkSweepGC

2. 配合ParNew新生代收集器

-XX:+UseParNewGC

3. 控制并发线程数

-XX:ParallelCMSThreads=4   # CMS并发线程数
-XX:ConcGCThreads=4        # 并发GC线程数（JDK8+）

4. 空间碎片与Full GC调优

自动空间压缩（默认关闭）
-XX:+UseCMSCompactAtFullCollection
Full GC时对老年代进行压缩，减少碎片，但会增加停顿。
触发压缩的Full GC阈值
-XX:CMSFullGCsBeforeCompaction=2
每2次Full GC后进行一次压缩。

5. 回收阈值与触发时机

老年代使用率阈值
-XX:CMSInitiatingOccupancyFraction=70
老年代使用率达到70%时触发CMS回收。
允许在CMS期间分配失败自动转Full GC
-XX:+CMSFullGCsBeforeCompaction

6. 其他常用参数

-XX:+CMSScavengeBeforeRemark：在Remark阶段前进行一次Minor GC，提升回收效率。
-XX:+CMSClassUnloadingEnabled：允许卸载无用类元数据，减少Metaspace压力。

六、常见问题与工程实践

1. Concurrent Mode Failure

回收速度跟不上分配速度，老年代被填满，JVM被迫触发Full GC（STW时间长）。
解决方法：
- 提前触发CMS（降低CMSInitiatingOccupancyFraction）
- 增大老年代空间
- 优化应用对象分配和生命周期

2. Promotion Failed

新生代晋升到老年代失败，可能因碎片或空间不足。
解决方法：
- 增大老年代
- 调整分区比例
- 优化对象分代策略

3. 碎片导致频繁Full GC

CMS不压缩空间，老年代碎片多时大对象分配失败。
解决方法：
- 启用Full GC时压缩
- 及时升级到G1等支持并发压缩的GC

4. CPU资源竞争

CMS并发阶段与应用线程争抢CPU，业务高峰期可能影响吞吐。
解决方法：
- 合理设置并发线程数
- 评估业务高峰期GC影响

七、GC日志分析

开启GC日志：

-XX:+PrintGCDetails -XX:+PrintGCDateStamps -Xloggc:/path/to/gc.log

CMS日志关键字段：

CMS-initial-mark：初始标记
CMS-concurrent-mark：并发标记
CMS-remark：重新标记
CMS-concurrent-sweep：并发清除
Full GC：Full GC发生
concurrent mode failure：并发回收失败

八、CMS与其他GC的对比

GC收集器	适用场景	优势	劣势
CMS	低延迟服务端	停顿短、并发	碎片、Full GC慢
G1	大堆、低延迟	并发+压缩、可预测	配置复杂、吞吐略低
Parallel	吞吐优先	吞吐高	停顿长
ZGC/Shenandoah	超大堆、极低延迟	停顿极短、并发压缩	JDK11+/新、成熟度有限

九、结论与建议

CMS适合对响应时间敏感、堆空间中等的服务端应用。
生产环境要重点关注碎片、Full GC、并发失败等问题。
JDK9以后建议优先采用G1或ZGC等新一代GC。
持续关注GC日志，结合业务负载动态调优。

十、参考资料

Oracle官方CMS文档
《深入理解Java虚拟机》第三版（周志明）
CMS GC调优实战
G1与CMS对比官方文档

十一、写屏障（Write Barrier）与卡表（Card Table）

1. 为什么需要写屏障？

在CMS的并发标记阶段，应用线程和GC线程同时运行。如果应用线程在GC标记时修改了对象引用（即“脏写”），会导致GC漏标记，造成误回收。

2. 写屏障机制

CMS采用写屏障（Write Barrier）机制拦截所有对象引用的写操作。当应用线程修改引用时，将被修改的“卡片”（Card）标记为脏（dirty），以便在重新标记（Remark）阶段重新扫描。

增量更新（Incremental Update）：标记所有在并发标记后被修改过的对象。
原始快照（Snapshot-at-the-Beginning）：标记所有在并发标记前已存在的引用。

CMS默认采用增量更新。

3. 卡表（Card Table）

堆被划分为固定大小的“卡片”（通常512字节）。
每个卡片有一个状态位，记录是否被修改。
写屏障会把对应卡片的状态置为脏。

十二、并发标记的难点与优化

1. 并发标记的挑战

应用线程持续创建和修改对象，GC线程很难捕捉所有变化。
写屏障和卡表机制保证了可达性分析的正确性，但带来一定性能开销。

2. 重新标记（Remark）阶段

由于并发期间有新引用产生，CMS需要STW下重新遍历脏卡片，确保所有可达对象都被正确标记。
这一步虽然STW，但比全表扫描快很多。

3. 与新生代GC的协作

在Remark前通常会触发一次Minor GC，减少新生代对老年代的引用变动。

十三、碎片问题底层分析

1. 标记-清除的本质

CMS只回收不可达对象，不移动存活对象。
多次GC后，老年代会出现大量不连续的小空洞（碎片）。

2. 碎片的实际危害

大对象分配时，虽然总空间足够，但没有足够大的连续内存，导致分配失败（Promotion Failed）。
JVM被迫触发Full GC，并进行内存压缩，造成长时间STW。

3. Full GC与压缩

Full GC会暂停所有线程，移动存活对象，合并碎片，但代价大。
CMS可通过参数定期触发压缩，但会丧失低延迟优势。

十四、参数调优实战

1. 常用参数说明

参数	作用	推荐设置
-XX:+UseConcMarkSweepGC	启用CMS	必须
-XX:CMSInitiatingOccupancyFraction=70	老年代使用率达到70%时触发CMS	50-80，根据业务负载调整
-XX:+UseCMSCompactAtFullCollection	Full GC时压缩老年代	建议开启
-XX:CMSFullGCsBeforeCompaction=2	每2次Full GC后压缩一次	1-5，视碎片情况调整
-XX:+CMSClassUnloadingEnabled	允许卸载无用类元数据	建议开启
-XX:+CMSScavengeBeforeRemark	Remark前先做一次Minor GC	建议开启
-XX:ParallelCMSThreads	并发GC线程数	一般为CPU数/2或CPU数

2. 实践建议

内存充裕时，适当增大老年代，减少GC频率。
延迟敏感时，降低CMSInitiatingOccupancyFraction，提前回收，避免Concurrent Mode Failure。
碎片严重时，调低CMSFullGCsBeforeCompaction，增加压缩频率。

十五、GC日志精细解读

示例日志片段：

2019-01-01T12:00:00.000+0800: 1.234: [GC (CMS Initial Mark) [1 CMS-initial-mark: 12345K(24576K)] 23456K(32768K), 0.0123456 secs] [Times: user=0.01 sys=0.00, real=0.01 secs]
2019-01-01T12:00:00.500+0800: 1.734: [GC (CMS Final Remark) [YG occupancy: 4096 K (8192 K)] 16384K(24576K), 0.0234567 secs] [Times: user=0.02 sys=0.00, real=0.02 secs]
2019-01-01T12:00:01.000+0800: 2.234: [GC (CMS Concurrent Sweep) ...]
2019-01-01T12:00:05.000+0800: 6.234: [Full GC (Allocation Failure) ...]