如果一个或多个对象没有任何的引用指向它了,那么这个对象现在就是垃圾
作用:释放没用的对象,清除内存里的记录碎片,碎片整理将所占用的堆内存移到堆的一端,以便 JVM 将整理出的内存分配给新的对象
垃圾收集主要是针对堆和方法区进行,程序计数器、虚拟机栈和本地方法栈这三个区域属于线程私有的,只存在于线程的生命周期内,线程结束之后就会消失,因此不需要对这三个区域进行垃圾回收
在堆里存放着几乎所有的 Java 对象实例,在 GC 执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为己经死亡的对象,GC 才会在执行垃圾回收时,释放掉其所占用的内存空间,因此这个过程可以称为垃圾标记阶段,判断对象存活一般有两种方式:引用计数算法和可达性分析算法
引用计数法
引用计数算法(Reference Counting):对每个对象保存一个整型的引用计数器属性,用于记录对象被引用的情况。对于一个对象 A,只要有任何一个对象引用了 A,则 A 的引用计数器就加 1;当引用失效时,引用计数器就减 1;当对象 A 的引用计数器的值为 0,即表示对象A不可能再被使用,可进行回收(Java 没有采用)
优点:
-
回收没有延迟性,无需等到内存不够的时候才开始回收,运行时根据对象计数器是否为 0,可以直接回收
-
在垃圾回收过程中,应用无需挂起;如果申请内存时,内存不足,则立刻报 OOM 错误
-
区域性,更新对象的计数器时,只是影响到该对象,不会扫描全部对象
缺点:
-
每次对象被引用时,都需要去更新计数器,有一点时间开销
-
浪费 CPU 资源,即使内存够用,仍然在运行时进行计数器的统计。
-
无法解决循环引用问题,会引发内存泄露(最大的缺点)

可达性分析
GC Roots
可达性分析算法:也可以称为根搜索算法、追踪性垃圾收集
GC Roots 对象:
-
虚拟机栈中局部变量表中引用的对象:各个线程被调用的方法中使用到的参数、局部变量等
-
本地方法栈中引用的对象
-
堆中类静态属性引用的对象
-
方法区中的常量引用的对象
-
字符串常量池(string Table)里的引用
-
同步锁 synchronized 持有的对象
GC Roots 是一组活跃的引用,不是对象,放在 GC Roots Set 集合
工作原理
可达性分析算法以根对象集合(GCRoots)为起始点,从上至下的方式搜索被根对象集合所连接的目标对象
分析工作必须在一个保障一致性的快照中进行,否则结果的准确性无法保证,这也是导致 GC 进行时必须 Stop The World 的一个原因
基本原理:
-
可达性分析算法后,内存中的存活对象都会被根对象集合直接或间接连接着,搜索走过的路径称为引用链
-
如果目标对象没有任何引用链相连,则是不可达的,就意味着该对象己经死亡,可以标记为垃圾对象
-
在可达性分析算法中,只有能够被根对象集合直接或者间接连接的对象才是存活对象

三色标记
标记算法
三色标记法把遍历对象图过程中遇到的对象,标记成以下三种颜色:
-
白色:尚未访问过
-
灰色:本对象已访问过,但是本对象引用到的其他对象尚未全部访问
-
黑色:本对象已访问过,而且本对象引用到的其他对象也全部访问完成
当 Stop The World (STW) 时,对象间的引用是不会发生变化的,可以轻松完成标记,遍历访问过程为:
-
初始时,所有对象都在白色集合
-
将 GC Roots 直接引用到的对象挪到灰色集合
-
从灰色集合中获取对象:
-
将本对象引用到的其他对象全部挪到灰色集合中
-
将本对象挪到黑色集合里面
-
-
重复步骤 3,直至灰色集合为空时结束
-
结束后,仍在白色集合的对象即为 GC Roots 不可达,可以进行回收

并发标记
并发标记时,对象间的引用可能发生变化,多标和漏标的情况就有可能发生
多标情况:当 E 变为灰色或黑色时,其他线程断开的 D 对 E 的引用,导致这部分对象仍会被标记为存活,本轮 GC 不会回收这部分内存,这部分本应该回收但是没有回收到的内存,被称之为浮动垃圾
-
针对并发标记开始后的新对象,通常的做法是直接全部当成黑色,也算浮动垃圾
-
浮动垃圾并不会影响应用程序的正确性,只是需要等到下一轮垃圾回收中才被清除

漏标情况:
-
条件一:灰色对象断开了对一个白色对象的引用(直接或间接),即灰色对象原成员变量的引用发生了变化
-
条件二:其他线程中修改了黑色对象,插入了一条或多条对该白色对象的新引用
-
结果:导致该白色对象当作垃圾被 GC,影响到了程序的正确性

为了解决问题,可以操作上面三步,将对象 G 记录起来,然后作为灰色对象再进行遍历,比如放到一个特定的集合,等初始的 GC Roots 遍历完(并发标记),再遍历该集合(重新标记)
所以重新标记需要 STW,应用程序一直在运行,该集合可能会一直增加新的对象,导致永远都运行不完
解决方法:添加读写屏障,读屏障拦截第一步,写屏障拦截第二三步,在读写前后进行一些后置处理:
-
写屏障 + 增量更新:黑色对象新增引用,会将黑色对象变成灰色对象,最后对该节点重新扫描
增量更新破坏了条件二,从而保证了不会漏标
缺点:对黑色变灰的对象重新扫描所有引用,比较耗费时间
-
写屏障+ SATB:当原来成员变量的引用发生变化之前,记录下原来的引用对象
保留 GC 开始时的对象图,即原始快照 SATB,当 GC Roots 确定后,对象图就已经确定,那后续的标记也应该是按照这个时刻的对象图走,如果期间对白色对象有了新的引用会记录下来,并且将白色对象变灰(说明可达了,并且原始快照中本来就应该是灰色对象),最后重新扫描该对象的引用关系
SATB (Snapshot At The Beginning) 破坏了条件一,从而保证了不会漏标
-
读屏障 (Load Barrier):破坏条件二,黑色对象引用白色对象的前提是获取到该对象,此时读屏障发挥作用
以 Java HotSpot VM 为例,其并发标记时对漏标的处理方案如下:
-
CMS:写屏障 + 增量更新
-
G1:写屏障 + SATB
-
ZGC:读屏障
哪些对象可以作为GC Roots
-
虚拟机栈(栈帧中的局部变量表)中引用的对象
-
本地方法栈(Native 方法)中引用的对象
-
方法区中类静态属性引用的对象
-
方法区中常量引用的对象
-
所有被同步锁持有的对象
-
JNI引用的对象
引用类型
四种引用类型
-
强引用:被强引用关联的对象不会被回收,只有所有 GCRoots 都不通过强引用引用该对象,才能被垃圾回收
-
强引用可以直接访问目标对象
-
虚拟机宁愿抛出 OOM 异常,也不会回收强引用所指向对象
-
强引用可能导致内存泄漏
-
-
软引用(SoftReference):被软引用关联的对象只有在内存不够的情况下才会被回收
-
仅(可能有强引用,一个对象可以被多个引用)有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收,回收软引用对象
-
配合引用队列来释放软引用自身,在构造软引用时,可以指定一个引用队列,当软引用对象被回收时,就会加入指定的引用队列,通过这个队列可以跟踪对象的回收情况
-
软引用通常用来实现内存敏感的缓存,比如高速缓存就有用到软引用;如果还有空闲内存,就可以暂时保留缓存,当内存不足时清理掉,这样就保证了使用缓存的同时不会耗尽内存
-
-
弱引用:被弱引用关联的对象一定会被回收,只能存活到下一次垃圾回收发生之前
-
仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
-
配合引用队列来释放弱引用自身
-
WeakHashMap 用来存储图片信息,可以在内存不足的时候及时回收,避免了 OOM
-
-
虚引用(PhantomReference):也称为幽灵引用或者幻影引用,是所有引用类型中最弱的一个
-
一个对象是否有虚引用的存在,不会对其生存时间造成影响,也无法通过虚引用得到一个对象
-
为对象设置虚引用的唯一目的是在于跟踪垃圾回收过程,能在这个对象被回收时收到一个系统通知
-
必须配合引用队列使用,主要配合 ByteBuffer 使用,被引用对象回收时会将虚引用入队,由 Reference Handler 线程调用虚引用相关方法释放直接内存
-
-
终结器引用
无用属性
无用类
方法区主要回收的是无用的类
判定一个类是否是无用的类,需要同时满足下面 3 个条件:
-
该类所有的实例都已经被回收,也就是 Java 堆中不存在该类的任何实例
-
加载该类的
ClassLoader已经被回收 -
该类对应的
java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法
虚拟机可以对满足上述 3 个条件的无用类进行回收,这里说的仅仅是可以,而并不是和对象一样不使用了就会必然被回收
废弃常量
在常量池中存在字符串 "abc",如果当前没有任何 String 对象引用该常量,说明常量 "abc" 是废弃常量,如果这时发生内存回收的话而且有必要的话(内存不够用),"abc" 就会被系统清理出常量池
静态变量
类加载时(第一次访问),这个类中所有静态成员就会被加载到静态变量区,该区域的成员一旦创建,直到程序退出才会被回收
如果是静态引用类型的变量,静态变量区只存储一份对象的引用地址,真正的对象在堆内,如果要回收该对象可以设置引用为 null
2642

被折叠的 条评论
为什么被折叠?



