小白搞懂了GC全过程，全靠阿里专家12张图-优快云博客

本文链接：https://blog.youkuaiyun.com/ftcool/article/details/106798989

本文深入浅出地介绍了Java的垃圾回收（GC）原理，以HotSpot JVM为例，详细讲解了堆内存结构，包括新生代、老年代和永久代的变化。通过可达性分析算法确定对象的可达性，并描述了Minor GC和Major GC的过程。文中还讨论了对象晋升到老年代的条件，如年龄限制、大对象直接晋升和动态对象年龄判定，以及老年代GC采用的标记清除和标记整理算法。阅读本文，读者将对Java GC有一个全面的理解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作者简介：曾任职于阿里巴巴，每日优鲜等互联网公司，任技术总监，15年电商互联网经历。

最近有些读者反应：看了很多网上关于JVM的文章，但是大部分文章不够通俗易懂，看不太明白。希望笔者能写几篇关于JVM的文章，刚好我也有这方面的打算。从本文开始推出JVM系列原创文章！

GC-垃圾回收，是Java程序员长聊的话题，理解JVM垃圾回收的原理和过程，不但有助于写出高质量高性能的代码，也可以帮你在面试官面前侃侃而谈！

读完本文，对垃圾回收过程、以及回收算法在垃圾回收中的应用，将会有一个全新的认识和理解。

堆内存结构

我们以Java官方的HotSpot JVM为例，在描述GC过程前，先了解一下堆内存的结构。

JVM将堆内存分为了三部分：新生代（Young Generation），老年代（Old Generation），永久代（Permanent Generation）。其中新生代又分为三部分：伊甸园区（Eden），和两个幸存区S0和S1。

注：JDK1.8之后，Java官方的HotSpot JVM去掉了永久代，取而代之的是元数据区Metaspace。Metaspace使用的是本地内存，而不是堆内存，也就是说在默认情况下Metaspace的大小只与本地内存的大小有关。因此JDK1.8之后，就见不到java.lang.OutOfMemoryError: PermGen space这种由于永久代空间不足导致的内存溢出的问题了。

垃圾回收全过程

新创建的对象会先被分配到到Eden区。JVM刚启动时，Eden区对象数量较少，两个Survivor区S0、S1几乎是空的。

随着时间的推移，Eden区的对象越来越多。当Eden区放不下时（占用空间达到容量阈值），新生代就会发生垃圾回收，我们称之为Minor GC或者Young GC。

发生GC时，第一步会通过可达性分析算法找到可达对象。如上图，蓝色为可达对象，其他紫色为不可达对象。第二步，被标示的可达对象会被转移到S0（此时S0是From Survivor），此时存活对象年龄加1，三个对象年龄都变为1。第三步，清除Eden区所有对象。

GC后各区域对象占用情况，如上图所示。

程序继续运行，Eden区再次达到容量阈值时，会再次发生GC。这时S0（From Survivor）已经有了对象。还是同样的步骤，通过可达性分析算法找到可达对象，然后再将Eden和S0中的可达对象转移到S1（To Survivor），各存活对象年龄加1。最后将Eden和S0中的所有对象清除。

GC后S0区域被清空。如上图所示。S0和S1发生了互换，S1变成了From Survivor，S0变成了To Survivor。

注意，To Survivor区永远都为空。这实际上是垃圾回收算法-复制算法在年轻代的实际应用。把年轻代分为Eden，S0，S1三个区域，每次垃圾回收时把可达对象复制到S0或S1，然后再清除掉Eden和（S1或S0）中的所有对象。由于每次GC时，新生代的可达对象非常少（绝大部分对象要被回收掉），一般不会超过新生代总体空间的10%，所以搜寻可达对象以及复制对象的成本都会非常低。而且这种复制的方式还能避免产生堆内存碎片，提高内存利用率。很多年轻代垃圾收集器都采用复制算法，如ParNew。

在程序运行过程中，新生代GC会反复发生，长寿对象会在S0和S1之间反复交换，年龄也会越来越大，当对象达到年龄上限时，会被晋升到老年代。这个年龄上限默认是15，可以通过参数-XX:MaxTenuringThreshold设置。如下图，有些年轻代对象年龄达到了上限15，被转移到了老年代。

其他晋升方式。新生代对象晋升到老年代，除了根据年龄正常晋升外。为了提高JVM的性能，JVM设计者还考虑了其他晋升方式。

大对象直接晋升。大对象会跨过年轻代直接分配到老年代。可以通过-XX:PretenureSizeThreshold参数设置对象大小。如果参数被设置成5MB，超过5MB的大对象会直接分配到老年代。这样做的目的，是为了避免大对象在Eden区及两个Survivor区之间大量的内存复制，大对象的内存复制耗时比普通对象要高很多。

注意：PretenureSizeThreshold参数只对Serial和ParNew两种回收器有效。

动态对象年龄判定。如果在Survivor空间中相同年龄对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象会直接进入老年代，而不用等到MaxTenuringThreshold中设置的年龄上限。上图，年龄为1的对象超过了Survivor空间的一半，所以这几个对象会直接进入老年代。

实际上，上面对动态对象年龄判定的描述并不精确。上图的场景也会导致相关对象晋升到老年代。年龄为1的对象加上年龄为2的对象超过了半数，这时包括年龄为2的对象以及年龄更大的对象都会被晋升到老年代。所以上图中年龄为2和3的对象都会被晋升到老年代。

老年代垃圾回收。随着年轻代对象的不断晋升，老年代的对象变得越来越多，达到容量阈值后老年代也会发生垃圾回收，我们称之为Major GC或者Full GC，Full GC并不是全局GC，它只发生在老年代。

虽然年轻代和老年代都会发生GC，但是每次GC的时间和成本却大不相同。由于老年代空间大小一般是年轻代的几倍，再加上老年代对象存活率很高，所以整个标记过程比较慢，GC成本也非常高。我们经常说的JVM调优，主要是为了尽量减少老年代Full GC的时间和频次。

老年代垃圾回收器，很少使用复制算法，主要为了避免大量对象的内存复制带来的时间和空间上的开销，一般采用标记清除、标记整理算法，就地标记回收。例如，老年代垃圾收集器CMS就采用了标记清除算法。对于标记清除算法带来的内存碎片问题，CMS提供了两个参数做碎片整理，-XX:+UseCMSCompactAtFullCollection和-XX:CMSFullGCsBeforeCompaction。

希望本文对大家有所帮助。原创不易，如果感觉本文有帮助，有劳转发或点一下“在看”！让更多人收获知识！

作者简介：曾任职于阿里巴巴，每日优鲜等互联网公司，任技术总监，15年电商互联网经历。

更多干货请关注微信公众号：架构师进阶之路