关于CMS的两个常用参数的解读

最新推荐文章于 2025-07-04 21:28:26 发布

转载最新推荐文章于 2025-07-04 21:28:26 发布 · 1.8k 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：https://www.jianshu.com/p/be5389ca93f7

文章标签：

#jvm #java

最近观看一个视频课程，关于CMS两个常用参数的讲解，提及“堆内存碎片的整理发生在N次CMS之后”；发现该结论与自己理解的不一致，遂翻查资料求证，现整理如下，备查。

Backgroud CMS
可能更多人只知道CMS，而不知道Backgroud CMS。事实上我们说的CMS，即包含了5个阶段的CMS，就是Background CMS：

初始标记阶段
并发标记阶段
重新标记阶段
并发清除阶段
并发重置阶段

说明：
初始化标记阶段是串行的，这是JDK7的行为。JDK8以后默认是并行的，可以通过参数-XX:+CMSParallelInitialMarkEnabled控制。
CMS有两个阶段是完全STW（Stop The World）的，即初始化标记和最终标记（重新标记）。
其他阶段都是并发的，所以CMS被称为Concurrent Mark&Sweep，但是我认为前面还需要加个Mostly才是最贴切，即CMS是一个Mostly Concurrent Mark and Sweep Garbage Collector，因为它还没办法做到完全并发。

不只是CMS，就是G1，以及JDK11的ZGC都没有做到完全的并发。就目前笔者了解到的所有GC中，只有Azul的C4是完全并发的。

为什么有个Background关键词？我们都知道配置CMS垃圾回收的话，有两个重要参数：-XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly，这两个参数表示只有在Old区占了75%的内存时才满足触发CMS的条件。注意这只是满足触发CMS GC的条件。至于什么时候真正触发CMS GC，由一个后台扫描线程决定。CMSThread默认2秒钟扫描一次，判断是否需要触发CMS，这个参数可以更改这个扫描时间间隔，例如-XX:CMSWaitDuration=5000，此外可以通过jstack日志看到这个线程：

"Concurrent Mark-Sweep GC Thread" os_prio=2 tid=0x000000001870f800 nid=0x0f4 waiting on condition

Foregroud CMS
这个名词第一次听笨神说的（公众号：你假笨）。当然笨神也不是随便自己捏造一个名词出来，这个名词来自于openjdk源码，参考concurrentMarkSweepGeneration.cpp：

void CMSCollector::collect_in_foreground(bool clear_all_soft_refs, GCCause::Cause cause) {
    case Resizing: {
        // nothing to be done in this state. 即这个阶段啥都没做
        _collectorState = Resetting;
        break;
    }  
    case Precleaning:
        // 预清理啥都没干
    case AbortablePreclean:
        // Elide(省略，取消的意思，相当于这个阶段也啥都没做) the preclean phase
        _collectorState = FinalMarking;
        break;
    default:
        ShouldNotReachHere();
}

它发生的场景，比如业务线程请求分配内存，但是内存不够了，于是可能触发一次CMS GC，这个过程就必须要等待内存分配成功后业务线程才能继续往下面走，因此整个过程必须STW，所以这种CMS GC整个过程都是STW，但是为了提高效率，它并不是每个阶段都会走的，只走其中一些阶段，通过上面的源码可知，这些省下来的阶段主要是并行阶段：Precleaning、AbortablePreclean，Resizing。但不管怎么说如果走了类似foreground这种CMS GC，那么整个过程业务线程都是不可用的，效率会影响挺大。

这事实上就是发生了FullGC，由这段的分析可知FullGC相比CMS Backgroud collect模式差距还是非常大的。

MSC
MSC的全称是Mark Sweep Compact，即标记-清理-压缩，MSC是一种算法，请注意Compact，即它会压缩整理堆，这一点很重要。

这是foreground CMS在特定情况下才会采用的一种垃圾回收算法。为什么这么说了，这里需要介绍两个参数，这两个参数表示多少次FullGC后采用MSC算法压缩堆内存，0表示每次FullGC后都会压缩，同时0也是默认值：

-XX:+UseCMSCompactAtFullCollection 
-XX:CMSFullGCsBeforeCompaction=0

配置-XX:+UseCMSCompactAtFullCollection（默认）前提下，如果CMSFullGCsBeforeCompaction=0，那么每次foreground
CMS后都会采用MSC算法压缩堆内存；如果CMSFullGCsBeforeCompaction=3，那么每3次foreground
CMS后才会有1次采用MSC算法压缩堆内存。

碎片问题也是CMS采用的标记清理算法最让人诟病的地方：Backgroud CMS采用的标记清理算法会导致内存碎片问题，从而埋下发生FullGC导致长时间STW的隐患。

所以如果触发了FullGC，无论是否会采用MSC算法压缩堆，那都是ParNew+CMS组合非常糟糕的情况。因为这个时候并发模式已经搞不定了，而且整个过程单线程，完全STW，可能会压缩堆（是否压缩堆通过上面两个参数控制），真的不能再糟糕了！想象如果这时候业务量比较大，由于FullGC导致服务完全暂停几秒钟，甚至上10秒，对用户体验影响得多大。

总结
堆的内存碎片整理发生在N次FullGC之后，而非N次CMS之后。

参考引用：https://www.jianshu.com/p/be5389ca93f7