JVM—垃圾收集器详细介绍

最新推荐文章于 2024-09-05 17:28:41 发布

多一天，多一点

最新推荐文章于 2024-09-05 17:28:41 发布

阅读量675

点赞数 2

分类专栏： JVM 文章标签： jvm

本文链接：https://blog.youkuaiyun.com/xioayu96/article/details/107300601

版权

JVM 专栏收录该内容

19 篇文章

订阅专栏

JVM—垃圾收集器详细介绍

7大垃圾收集器间的相互关系及说明

在这里插入图片描述

两个收集器间有连线，表明它们可以搭配使用： Serial—Serial Old、Serial—CMS、 ParNew—Serial Old、ParNew—CMS、 Parallel Scaveng—Serial Old、Parallel Scavenge—Parallel Old、G1；
其中Serial Old作为CMS 出现"Concurrent Mode Failure"失败的后备垃圾收集器。
- 因为CMS是并发的垃圾收集器，当内存将要用完时就开始进行垃圾回收了，如果当CMS回收失败，则Serial Old GC作为替补角色，进行垃圾回收，这也是为什么CMS GC和Serial Old GC之间有连线的原因
**红色虚线：**由于维护和兼容性测试的成本，在JDK 8时将Serial+CMS、 ParNew+Serial Old这两个组合声明为废弃），并在JDK 9中完全取消了这些组合的支持。
**绿色虚线：**JDK 14中：弃用Parallel Scavenge和Seria lOld GC组合
**青色虚线：**JDK 14中：彻底删除了CMS垃圾收集器

一、Serial与Serial Old收集器(串行)

在这里插入图片描述

1.1 Serial GC

Serial收集器是最基本、历史最悠久的垃圾收集器了。JDK1.3之前回收新生代唯一的选择。

Serial收集器作为HotSpot中Client模式下的默认新生代垃圾收集器。

Serial收集器采用复制算法、串行回收和"STW"机制的方式执行内存回收。

1.2 Serial Old GC

Serial Old收集器同样也采用了串行回收和"STW"机制，只不过内存回收算法使用的是标记一压缩算法。

Serial Old是运行在Client模式下默认的老年代的垃圾回收器

Serial Old在Server模式下主要有两个用途：

与新生代的Parallel GC配合使用;
作为老年代CMS GC的后备垃圾收集方案

这个收集器是一个单线程的收集器，但它的“单线程”的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作，更重要的是在它进行垃圾收集时，必须暂停其他所有的工作线程，直到它收集结束（STW）。

1.3 特点与应用场景

**特点：**简单而高效（与其他收集器的单线程比），对于限定单个CPU的环境来说，Serial收集器由于没有线程交互的开销，专心做垃圾收集自然可以获得最高的单线程收集效率。

➢运行在Client模式下的虛拟机是个不错的选择。

**应用场景：**在用户的桌面应用场景中，可用内存一般不大（几十MB至一两百MB），可以在较短时间内完成垃圾收集（几十ms至一百多ms），只要不频繁发生，使用串行回收器是可以接受的。

这种垃圾收集器大家了解就行，现在已经不用串行的了。而且在限定单核cpu才可以用。现在都不是单核的了。
对于交互较强的应用而言，这种垃圾收集器是不能接受的。T一般在Javaweb应用程序中是不会采用串行垃圾收集器的。

1.4 参数设置

在HotSpot虛拟机中，使用一XX:+UseSerialGC参数可以指定年轻代和老年代都使用串行收集器。

/**
 * @Des :   -XX:+PrintCommandLineFlags：打印命令行参数
 *          使用jinfo -flag 参数 进程ID
 *        -XX:+UseSerialGC:表明新生代使用Serial GC ，同时老年代使用Serial Old GC
 *
 *        -XX:+UseParNewGC：标明新生代使用ParNew GC
 *
 *        -XX:+UseParallelGC:表明新生代使用Parallel GC
 *
 *        -XX:+UseParallelOldGC : 表明老年代使用 Parallel Old GC 二者可以相互激活，即设置了一个，对应的另外一个自动使用
 *
 *        -XX:+UseConcMarkSweepGC：表明老年代使用CMS GC。同时，年轻代会触发对ParNew GC的使用
 */
public class GCUseTest {
    public static void main(String[] args) throws InterruptedException {
        ArrayList<byte[]> list = new ArrayList<>();

        while(true){
            byte[] arr = new byte[100];
            list.add(arr);
            Thread.sleep(10);
        }
    }
}

二、ParNew收集器(并行)

在这里插入图片描述

ParNew收集器则是Serial收集器的多线程版本。

ParNew收集器除了采用并行回收的方式执行内存回收外，两款垃圾收集器之间几乎没有任何区别。ParNew收集器在年轻代中同样也是采用复制算法、"STW"机制。

ParNew是很多JVM运行在Server模式下新生代的默认垃圾收集器。

2.1 为什么新生代采用并行收集，老年代采用串行收集

新生代中的对象朝生夕死，回收频繁，采用并行垃圾收集器效率更高。

老年代中的对象存活时间较长，回收次数较少，采用串行方式会节省资源，因为CPU线程间的上下文切换需要消耗CPU性能。

2.2 ParNew GC 与Serial GC对比

ParNew 收集器运行在多CPU的环境下，由于可以充分利用多CPU、多核心等物理硬件资源优势，可以更快速地完成垃圾收集，提升程序的吞吐量。

在单个CPU的环境下，ParNew收集器不比Serial收集器更高效。虽然Serial收集器是基于串行回收，但是由于CPU不需要频繁地做任务切换，因此可以有效避免多线程交互过程中产生的一些额外开销。

2.3 参数设置

在程序中，开发人员可以通过选项"一XX:+UseParNewGC"手动指定使用ParNew收集器。它表示年轻代使用并行收集器，不影响老年代。

一XX:ParallelGCThreads 限制线程数量，默认开启和CPU数据相同的线程数。

可以使用《1.4参数设置》的代码自行测试

三、Parallel与Parallel Old收集器(吞吐量优先)

Parallel GC也是基于复制算法的并行垃圾收集器，也会导致STW的发生。

在程序吞吐量优先的应用场景中，Parallel 收集器和Parallel Old收集器的组合，在Server模式下的内存回收性能很不错。

在Java8中，默认是此垃圾收集器

在这里插入图片描述

3.1 Parallel GC 与ParNew GC比较

和ParNew收集器不同，Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量，所以也被称为吞吐量优先的垃圾收集器。
自适应调节策略也是Parallel Scavenge 与ParNew一个重要区别。

3.2 Parallel GC适用场景

高吞吐量则可以高效率地利用CPU 时间，尽快完成程序的运算任务，主要适合在后台运算而不需要太多交互的任务。因此，常见在服务器环境中使用。例如，那些执行批量处理、订单处理、工资支付、科学计算的应用程序。

3.3 Parallel Old GC

Parallel收集器在JDK1.6时提供了用于执行老年代垃圾收集的Parallel Old收集器，用来代替老年代的Serial Old收集器。

Parallel Old收集器采用了标记一压缩算法，但同样也是基于并行回收和”Stop一the一World"机制。

3.4 参数设置

一XX:+UseParallelGC：手动指定年轻代使用Parallel GC。

一XX: +UseParallelOldGC：手动指定老年代都是使用并行回收收集器。

分别适用于新生代和老年代。默认jdk8是开启的。
上面两个参数，默认开启一个，另一个也会被开启。（互相激活）

一XX: ParallelGCThreads：设置年轻代并行收集器的线程数。一般地，最好与CPU数量相等，以避免过多的线程数影响垃圾收集性能。

在默认情况下，当CPU数量小于8个，ParallelGCThreads 的值等于CPU数量。
当CPU数量大于8个， ParallelGCThreads的值等于3+[5*CPU_ Count]/8]

一XX:MaxGCPau3eMillis：设置垃圾收集器最大停顿时间（即STW的时间）。单位是毫秒。

➢为了尽可能地把停顿时间控制在MaxGCPauseMills以内，收集器在.工作时会调整Java堆大小或者其他一些参数。
➢对于用户来讲，停顿时间越短体验越好。但是在服务器端，我们注重高并发，整体的吞吐量。所以服务器端适合Parallel进行控制。该参数使用需谨慎。

一XX:GCTimeRatio：垃圾收集时间占总时间的比例（= 1 / （N + 1））用于衡量吞吐量的大小。

➢取值范围（0， 100）。默认值99，也就是垃圾回收时间不超过1%。
➢与前面一XX：MaxGCPauseMillis参数有一定矛盾性。暂停时间越长，Radio参数就容易超过设定的比例。

一XX: +UseAdaptiveSizePolicy：设置Parallel Scavenge收集器具有自适应调节策略

在这种模式下，年轻代的大小、Eden和Survivor的比例、晋升老年代的对象年龄等参数会被自动调整，已达到在堆大小、吞吐量和停顿时间之间的平衡点。
在手动调优比较困难的场合，可以直接使用这种自适应的方式，仅指定虚拟机的最大堆、目标的吞吐量（GCTimeRatio）和停顿时间（MaxGCPauseMills），让虚拟机自己完成调优工作。

可以使用《1.4参数设置》的代码自行测试

四、CMS 收集器(低延迟)

4.1 CMS GC 概述

JDK1.5版本，HotSpot推出了一款在强交互应用中几乎可认为有划时代意义的垃圾收集器：CMS （Concurrent 一Mark 一 Sweep）收集器，这款收集器是HotSpot虚拟机中第一款真正意义上的并发收集器，它第一次实现了让垃圾收集线程与用户线程同时工作。

CMS的垃圾收集算法采用标记一清除算法，并且也会" STW"

在这里插入图片描述

CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短（低延迟）就越适合与用户交互的程序，良好的响应速度能提升用户体验。

目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上，这类应用尤其重视服务的响应速度，希望系统停顿时间最短，以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。

不幸的是，CMS 作为老年代的收集器，却无法与JDK1.4 中已经存在的新生代收集器Parallel GC配合工作，所以在JDK 1. 5中使用CMS来收集老年代的时候，新生代只能选择ParNew或者Serial收集器中的一个。

在G1出现之前，CMS使用还是非常广泛的。一直到今天，仍然有很多系统使用CMS GC。

4.2 CMS运作过程

CMS整个过程比之前的收集器要复杂，从上图也可以看出整个过程分为4个主要阶段，即初始标记阶段、并发标记阶段、重新标记阶段和并发清除阶段。

4.2.1 初始标记阶段(STW)

在这个阶段中，程序中所有的工作线程都将会因为“STW"机制而出现短暂的暂停，这个阶段的主要任务仅仅只是标记出GCRoots能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用线程。由于直接关联对象比较小，所以这里的速度非常快。

4.2.2 并发标记阶段

从GC Roots的直接关联对象开始遍历整个对象图的过程，这个过程耗时较长但是不需要停顿用户线程，可以与垃圾收集线程一起并发运行。

4.2.3 重新标记阶段(STW)

由于在并发标记阶段中，程序的工作线程会和垃圾收集线程同时运行或者交叉运行，因此为了修正并发标记期间，因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录，这个阶段会导致STW，且停顿时间通常会比初始标记阶段稍长一些，但也远比并发标记阶段的时间短。

4.2.4 并发清除阶段

此阶段清理删除掉标记阶段判断的已经死亡的对象，释放内存空间。由于不需要移动存活对象(采用的标记-清除算法)，所以这个阶段也是可以与用户线程同时并发的

由于在整个过程中耗时最长的并发标记和并发清除阶段中，垃圾收集器线程都可以与用户线程一起工作，所以从总体上来说， CMS收集器的内存回收过程是与用户线程一起并发执行的。

4.3 CMS垃圾收集机制

由于在垃圾收集阶段用户线程没有中断，所以在CMS回收过程中，还应该确保应用程序用户线程有足够的内存可用。因此，CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集，而是当堆内存使用率达到某一阈值时，便开始进行回收，以确保应用程序在CMS工作过程中依然有足够的空间支持应用程序运行。要是CMS运行期间预留的内存无法满足程序需要，就会出现一次“Concurrent Mode Failure”失败，这时虚拟机将启动后备预案：临时启用Serial Old收集器来重新进行老年代的垃圾收集，这样停顿时间就很长了。

4.4 CMS优缺点

4.1 优点

从整体上来说，与用户线程并发执行
低延迟，因为最耗时的过程是并发执行的，即并发标记阶段和并发清除阶段

4.2 缺点

① CMS收集器对处理器资源非常敏感

在并发阶段，它虽然不会导致用户停顿，但是会因为占用了一部分线程而导致应用程序变慢，总吞吐量会降低。
CMS默认启动的回收线程数是（处理器核心数量+3） /4，也就是说，如果处理器核心数在四个或以上，并发回收时垃圾收集线程只占用不超过25%的处理器运算资源，并且会随着处理器核心数量的增加而下降。但是当处理器核心数量不足四个时，CMS对用户程序的影响就可能变得很大。如果应用本来的处理器负载就很高，还要分出一半的运算能力去执行收集器线程，就可能导致用户程序的执行速度忽然大幅降低。

②CMS收集器无法处理浮动垃圾

可能出现“Concurrent Mode Failure" 失败而导致另一次Full GC的产生（此时就会使用Serial OldGC来进行垃圾收集）。在并发标记阶段和并发清除阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的，程序在运行自然就还会伴随有新的垃圾对象不断产生，但这一部分垃圾对象是出现在标记过程结束以后，CMS将无法对这些垃圾对象进行标记，最终会导致这些新产生的垃圾对象没有被及时回收，从而只能在下一次执行GC时释放这些之前未被回收的内存空间。

③会产生大量内存碎片

CMS收集器的垃圾收集算法采用的是标记一清除算法，这意味着每次执行完内存回收后，由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块，不可避免地将会产生一些内存碎片。那么CMS在为新对象分配内存空间时，将无法使用指针碰撞（Bump the Pointer）技术，而只能够选择空闲列表（Free List）执行内存分配。
空间碎片过多时，将会给大对象分配带来很大麻烦，往往会出现老年代还有很多剩余空间，但就是无法找到足够大的连续空间来分配当前对象，而不得不提前触发一次Full GC的情况。

4.3 CMS为什么不把标记-清除换成标记-压缩？

因为标记-压缩算法在整理内存空间时，需要STW，而CMS又是一款低延迟的垃圾收集器，STW时间过长，就会失去它原本的意义。所以标记-压缩算法适用于STW时间稍长的场景。

4.5 CMS参数设置

一XX:+UseConcMarkSweepGC：手动指定使用CMS收集器执行内存回收任务。

开启该参数后会自动将一XX:+UseParNewGC打开。即：ParNew（Young区用）+CMS（Old区用） +Serial Old的组合。
如果在jdk9及及以上版本的Hotspot虚拟机中使用此参数，则会有一条警告信息

在这里插入图片描述

一XX:CMSlnitiatingOccupanyFraction：设置堆内存使用率的阈值，一旦达到该阈值，便开始进行回收。

JDK5及以前版本的默认值为68，即当老年代的空间使用率达到68%时，会执行一 .次CMS 回收。 JDK6及以后版本默认值为92%
如果内存增长缓慢，则可以设置一个稍大的值，大的阈值可以有效降低CMS的触发频率，减少老年代回收的次数可以较为明显地改善应用程序性能。反之，如果应用程序内存使用率增长很快，则应该降低这个阈值，以避免频繁触发老年代串行收集器。因此通过该选项便可以有效降低Full GC的执行次数。

一XX: +UseCMSCompactAtFullCollection：用于指定在执行完Full GC后对内存空间进行压缩整理，以此避免内存碎片的产生。不过由于内存压缩整理过程无法并发执行，所带来的问题就是停顿时间变得更长了。

一XX:CMSFullGCsBeforeCompaction：设置在执行多少次Full GC后对内存空间进行压缩整理。

一XX:ParallelCMSThreads：设置CMS的线程数量。

CMS 默认启动的线程数是**（ParallelGCThreads+3） /4**， ParallelGCThreads是年轻代并行收集器的线程数。当CPU资源比较紧张时，受到CMS收集器线程的影响，应用程序的性能在垃圾回收阶段可能会非常糟糕。

4.6 Serial GC、Parallel GC、CMS GC区别

4.6.1 Serial GC

简单而高效（与其他收集器的单线程比），对于限定单个CPU的环境来说，Serial收集器由于没有线程交互的开销，专心做垃圾收集自然可以获得最高的单线程收集效率。适用于在用户的桌面应用场景中，可用内存一般不大（几十MB至一两百MB)。

一句话来说：想要最小化地使用内存和并行开销，请选Serial GC

4.6.2 Parallel GC

Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量，所以也被称为吞吐量优先的垃圾收集器。高吞吐量则可以高效率地利用CPU 时间，尽快完成程序的运算任务，主要适合在后台运算而不需要太多交互的任务。因此，常见在服务器环境中使用。例如，那些执行批量处理、订单处理、工资支付、科学计算的应用程序。

一句话来说：想要最大化应用程序的吞吐量，请选Parallel GC

4.6.3 CMS GC

CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短（低延迟）就越适合与用户交互的程序，良好的响应速度能提升用户体验。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上，这类应用尤其重视服务的响应速度，希望系统停顿时间最短，以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求。

一句话来说：想要最小化GC的中断或停顿时间，请选CMS GC

4.7 CMS后续版本变化

JDK9新特性： CMS被标记为Deprecate了，即将要废弃

如果对JDK 9及以上版本的HotSpot虚拟机使用参数一XX：+UseConcMarkSweepGC来开启CMS收集器的话，用户会收到一个警告信息，提示CMS未来将会被废弃。

JDK14新特性：删除CMS垃圾回收器，即彻底被删除了

移除了CMS垃圾收集器，如果在JDK14中使用一XX： +UseConcMarkSweepGC的话，JVM不会报错，只是给出一个warning信息，但是不会exit。JVM会自动回退以默认GC方式启动JVM

五、G1收集器(区域化分代式)

5.1 G1概述

原因在于应用程序所应对的业务越来越庞大、复杂，用户越来越多，没有GC就不能保证应用程序正常进行，而经常造成STW的GC又跟不上实际的需求，所以才会不断地尝试对GC进行优化。G1（Garbage First）垃圾回收器是在Java7 update4之后引入的一个新的垃圾回收器，是当今收集器技术发展的最前沿成果之一。
与此同时，为了适应现在不断扩大的内存和不断增加的处理器数量，进一步降低暂停时间（pause time），同时兼顾良好的吞吐量。
官方给G1设定的目标是在延迟可控的情况下获得尽可能高的吞吐量，所以才担当起“全功能收集器”的重任与期望

因为G1是一个并行回收器，它把堆内存分割为很多不相关的区域（Region）（物理上不连续的）。使用不同的Region来表示Eden、幸存者0区，幸存者1区，老年代等。G1 GC有计划地避免在整个Java 堆中进行全区域的垃圾收集。G1跟踪各个Region 里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region。由于这种方式的侧重点在于回收垃圾最大量的区间（Region）， 这也就是“Garbage First”名字的由来。

G1 GC从整体上来说，使用的是标记-整理算法，从局部GC Region来看，使用的是复制算法，所以说，G1 GC使用的是标记-整理算法+复制算法

5.2 Region(分区)

使用G1收集器时，它将整个Java堆划分成约2048个大小相同的独立Region块，且在JVM生命周期内不会被改变，每个Region块大小根据堆空间的实际大小而定，整体被控制在1MB到32MB之间，且为2的N次幂，即1MB，2MB，4MB， 8MB，16MB，32MB。可以通过一 XX:G1HeapRegionSize设定。
G1收集器虽然还保留有新生代和老年代的概念，但新生代和老年代不再是物理隔离的了，它们都是一部分Region （不需要连续）的集合。通过Region的动态分配方式实现逻辑上的连续。如下图：

在这里插入图片描述

一个region 有可能属于Eden， Survivor 或者Old内存区域。但是一个region只可能属于一个角色，在被回收后重新分配角色。图中的E表示该region属于Eden内存区域，s表示属于Survivor内存区域，0表示属于0ld内存区域。图中空白的表示未使用的内存空间。

Region中还有一类特殊的Humongous区域，如上图中的H块。主要用于存储大对象，如果超过1. 5个region，就放到Humongous区域；如果超过1Region且不超过1.5个Region，则使用两个连续的空Region块来存放。

设置H的原因：

对于堆中的大对象，默认直接会被分配到老年代，但是如果它是一个短期存在的大对象，就会对垃圾收集器造成负面影响。为了解决这个问题，G1划分了一个Humongous区，它用来专门存放大对象。如果一个H区装不下一个大对象，那么G1会寻找连续的H区来存储。为了能找到连续的H区，有时候不得不启动Full GC。G1的大多数行为都把H区作为老年代的一部分来看待。

5.3 G1收集器垃圾回收过程

G1中提供了三种垃圾回收模式： YoungGC、 Mixed GC和Full GC，在不同的条件下被触发。

G1 GC的垃圾回收过程主要包括如下三个环节：

年轻代GC （Young GC ）
老年代并发标记过程（ Concurrent Marking）
混合回收（Mixed GC ）
（如果需要，单线程、独占式、高强度的Full GC还是继续存在的。它针对GC的评估失败提供了一种失败保护机制，即强力回收。）

顺时针， Minor GC 一>Concurrent Mark 一> Mixed GC顺序，进行垃圾回收。

在这里插入图片描述

应用程序分配内存，当年轻代的Eden区用尽时开始年轻代回收过程；。在年轻代回收期，G1 GC暂停所有应用程序线程，启动多线程执行年轻代回收。然后从年轻代区间移动存活对象到Survivor区间或者老年区间，也有可能是两个区间都会涉及。
当堆内存使用达到一定值（默认45%）时，开始老年代并发标记过程。
标记完成马上开始混合回收过程。对于一个混合回收期，G1 GC从老年区间移动存活对象到空闲区间，这些空闲区间也就成为了老年代的一部分。和年轻代不同，老年代的G1回收器和其他GC不同，G1的老年代回收器不需要整个老年代被回收，一次只需要扫描/回收一小部分老年代的Region就可以了。同时，这个老年代Region是和年轻代一起被回收的。

举个例子：一个web服务器，Java进程最大堆内存为4G，每分钟响应1500个请求，每45秒钟会新分配大约2G的内存。G1会每45秒钟进行一次年轻代回收，每31 个小时整个堆的使用率会达到45号，会开始老年代并发标记过程，标记完成后开始四到五次的混合回收。

5.3.1 年轻代GC

Rest：解决分代引用问题的记忆集。

年轻代回收是一个STW的过程，它的跨代引用使用RSet数据结构来追溯，会一次性回收掉年轻代的所有Region。
JVM启动时G1会先准备好Eden区，程序在运行过程中不断创建对象到Eden区，当所有的Eden区都满了，G1会启动一次年轻代的垃圾回收过程。

在这里插入图片描述

具体回收过程：

扫描根。
根是指static变量指向的对象，正在执行的方法调用链条上的局部变量等。根引用连同RSet记录的外部引用作为扫描存活对象的入口。
更新RSet

处理dirty card queue中的card，更新RSet。此阶段完成后，RSet可以准确的反映老年代对所在的内存分段中对象的引用。
- dirty card queue: 对于应用程序的引用赋值语句object.field=object，JVM会在之前和之后执行特殊的操作以在dirty card queue中入队一个保存了对象引用信息的card。在年轻代回收的时候， G1会对Dirty Card Queue中所有的card进行处理，以更新RSet，保证RSet实时准确的反映引用关系。那为什么不在引用赋值语句处直接更新RSet呢？这是为了性能的需要，RSet的处理需要线程同步，开销会很大，使用队列性能会好很多。
处理RSet。
识别被老年代对象指向的Eden中的对象，这些被指向的Eden中的对象被认为是存活的对象。
复制对象。
此阶段，对象树被遍历，Eden区内存段中存活的对象会被复制到Survivor区中空的内存分段，Survivor区内存段中存活的对象如果年龄未达阈值，年龄会加1，达到阀值会被会被复制到01d区中空的内存分段。如果Survivor空间不够，Eden空间的部分数据会直接晋升到老年代空间。
处理引用。
处理Soft，Weak， Phantom， Final， JNI Weak等引用。最终Eden空间的数据为空，GC停止工作，而目标内存中的对象都是连续存储的，没有碎片，所以复制过程可以达到内存整理的效果，减少碎片。

5.3.2 并发标记过程

当整个堆内存使用达到一定比例(默认是45%)，并发标记阶段就会被启动。

初始标记（Initial Mark）这个过程共用了Minor GC的暂停，这是因为它们可以复用root scan操作。虽然是STW的，但是过程很短
根区域扫描（Root Region Scanning）： G1 GC扫描Survivor区直接可达的老年代区域对象，并标记被引用的对象。这一过程必须在young GC之前完成。
并发标记（Concurrent Marking）：在整个堆中进行并发标记（和应用程序并发执行），此过程可能被Young GC中断。在并发标记阶段，若发现区域对象中的所有对象都是垃圾，那这个区域会被立即回收。同时，并发标记过程中，会计算每个区域的对象活性（区域中存活对象的比例）。
重新标记（Remark）：也称为最终标记，由于应用程序持续进行，需要修正上一次的标记结果。是STW的。
- G1中采用了比CMS更快的初始快照算法：snapshot一at一the一beginning （SATB）。
独占清理（cleanup，STW）：计算各个区域的存活对象和GC回收比例，并进行排序，识别可以混合回收的区域。为下阶段做铺垫。是STW的。
- 这个阶段并不会实际上去做垃圾的收集
并发清理：如果发现Region里全是垃圾，这个阶段立马被清理掉；不全是垃圾的Region，并不会被立马处理，它会在Mixed GC阶段，进行收集。

SATB算法：这个算法是逻辑上的，只要是有几个指针，将Region分成多个区段。如图所示，并发标记期间分配的对象，都会在next TAMS 和top之间，如下图

在这里插入图片描述

5.3.3 混合回收

当越来越多的对象晋升到老年代OldRegion时，为了避免堆内存被耗尽，虚拟机会触发一个混合的垃圾收集器，即Mixed GC，该算法并不是一个OldGC，除了回收整个Young Region，还会回收一部分的OldRegion。这里需要注意：是一部分老年代，而不是全部老年代。可以选择哪些OldRegion进行收集，从而可以对垃圾回收的耗时时间进行控制。也要注意的是Mixed GC并不是Full GC。

并发标记结束以后，老年代中百分百为垃圾的内存分段被回收了，部分为垃圾的内存分段被计算了出来。默认情况下，这些老年代的内存分段会分8次（可以通过一XX:G1MixedGCCountTarget设置）被回收。
混合回收的回收集（Collection Set）包括八分之一的老年代内存分段，Eden区内存分段，Survivor区内存分段。混合回收的算法和年轻代回收的算法完全一样，只是回收集多了老年代的内存分段。具体过程请参考上面的年轻代回收过程。
由于老年代中的内存分段默认分8次回收，G1会优先回收垃圾多的内存分段。垃圾占内存分段比例越高的，越会被先回收。并且有一个阈值会决定内存分段是否被回收，一XX:G1MixedGCLiveThresholdPercent，默认为65%，意思是垃圾占内存分段比例要达到65%才会被回收。如果垃圾占比太低，意味着存活的对象占比高，在复制的时候会花费更多的时间。
混合回收并不一定要进行8次。有一个阈值一XX:G1HeapWastePercent，默认值为10%，意思是允许整个堆内存中有10%的空间被浪费，意味着如果发现可以回收的垃圾占堆内存的比例低于10%，则不再进行混合回收。因为GC会花费很多的时间但是回收到的内存却很少。

5.3.4 Full GC

G1的初衷就是要避免Full GC的出现。但是如果上述方式不能正常工作，G1会停止应用程序的执行（STW），使用单线程的内存回收算法进行垃圾回收，性能会非常差，应用程序停顿时间会很长。
要避免Full GC的发生，一旦发生需要进行调整。什么时候会发生Full GC呢？比如堆内存太小，当G1在复制存活对象的时候没有空的内存分段可用，则会回退到full gc，这种情况可以通过增大内存解决。
导致G1Full GC的原因可能有两个：

1.回收的时候没有足够的to一 space来存放晋升的对象；
2.并发处理过程完成之前空间耗尽。

5.4 G1优缺点

5.4.1 优点

并行与并发

并行性： G1在回收期间，可以有多个GC线程同时工作，有效利用多核计算能力。此时用户线程STW
- Minor GC、重新标记、独占清理阶段会STW。
并发性： G1拥有与应用程序交替执行的能力，部分工作可以和应用程序同时执行，因此，一般来说，不会在整个回收阶段发生完全阻塞应用程序的情况
- 并发标记、并发清理阶段不会STW。

分区收集

从分代上看，G1依然属于分代型垃圾回收器，它会区分年轻代和老年代，年轻代依然有Eden区和Survivor区。但从堆的结构上看，它不要求整个Eden区、年轻代或者老年代都是连续的，也不再坚持固定大小和固定数量。
将堆空间分为若干个区域（Region），这些区域中包含了逻辑上的年轻代和老年代。
和之前的各类回收器不同，它同时兼顾年轻代和老年代。对比其他回收器，或者工作在年轻代，或者工作在老年代；

空间整合

CMS： “标记一清除”算法、内存碎片、若干次Gc后进行一次碎片整理
G1将内存划分为一个个的Region。内存的回收是以Region作为基本单位的。Region之间是复制算法，但整体上实际可看作是标记一压缩（Mark一Compact）算法，两种算法都可以避免内存碎片。这种特性有利于程序长时间运行，分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。尤其是当Java堆非常大的时候，G1的优势更加明显。
可预测的停顿时间模型（即：软实时soft real一time）这是G1相对于CMS的另一大优势，G1除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不得超过N毫秒。
- 简单来说就是STW时间可控。
由于分区的原因，G1可以只选取部分区域进行内存回收，这样缩小了回收的范围，因此对于全局停顿情况的发生也能得到较好的控制。
G1跟踪各个Region里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region。保证了G1 收集器在有限的时间内可以获取尽可能高的收集效率。
相比于CMS GC，G1未必能做到CMS在最好情况下的延时停顿，但是最差情况要好很多。

5.4.2 缺点

G1的每个Region都得有一份卡表，这就使得G1的记忆集可能会占用整个堆容量的20%甚至更多。CMS就只有一份，同时CMS只需要维护老年代到新生代的引用，能省下不少的空间。
在执行负载角度来看，G1由于整体结构与逻辑变得复杂，相对应写屏障那边的逻辑也是比较复杂的，在用户程序运行过程中会产生由跟踪引用变化所带来的的额外开销。最终导致要G1比CMS消耗的资源要更多。

5.5 参数设置

一XX:+UseG1GC：手动指定使用G1收集器执行内存回收任务。

一XX:G1HeapRegionSize：设置每个Region的大小。值是2的幂，范围是1MB 到32MB之间，目标是根据最小的Java堆大小划分出约2048个区域。默认是堆内存的1/2000。

一XX:MaxGCPauseMillis：设置期望达到的最大Gc停顿时间指标（JVM会尽力实现，但不保证达到）。默认值是200ms

一XX:ParallelGCThread：设置STW工作线程数的值。最多设置为8

一XX:ConcGCThreads：设置并发标记的线程数。将n设置为并行垃圾回收线程数（ParallelGCThreads）的1/4左右。

一XX:Ini tiatingHeapOccupancyPercent：设置触发并发GC周期的Java堆占用率阈值。超过此值，就触发GC。默认值是45。

5.6 适用场景

面向服务端应用，针对具有大内存、多处理器的机器。（在普通大小的堆里优势并不明显）

最主要的应用是需要低GC延迟，并具有大堆的应用程序提供解决方案；

如：在堆大小约6GB或更大时，可预测的暂停时间可以低于0.5秒；（ G1通过每次只清理一部分而不是全部的Region的增量式清理来保证每次GC停顿时间不会过长）。

用来替换掉JDK1.5中的CMS收集器；在下面的情况时，使用G1可能比CMS好：
①超过50%的Java堆被活动数据占用；
②对象分配频率或年代提升频率变化很大；
③GC停顿时间过长（长于0. 5至1秒）。

HotSpot垃圾收集器里，除了G1以外，其他的垃圾收集器使用内置的JVM线程执行 GC的多线程操作，而G1 GC可以采用应用线程承担后台运行的GC工作，即当JVM的GC线程处理速度慢时，系统会调用应用程序线程帮助加速垃圾回收过程。

5.7 G1优化建议

年轻代大小
- 避免使用一Xmn或一XX:NewRatio等相关选项显式设置年轻代大小
- 固定年轻代的大小会覆盖暂停时间目标
暂停时间目标不要太过严苛
- G1 GC的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间
- 评估G1 GC的吞吐量时，暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销，而这些会直接影响到吞吐量。