垃圾判断
- 对象被判定为垃圾的标准
没有被其他对象引用
- 判定对象是否为垃圾的算法
引用计数算法
- 概述
(1)通过判断对象的引用数量来决定对象是否可以被回收
(2)每个对象实例都有一个引用计数器,被引用则+1,完成引用则-1
(3)任何引用计数为0的对象实例可以当作垃圾收集- 优点:执行效率高,程序执行受影响较小
- 缺点:无法检测出循环引用(两个对象相互引用)的情况,导致内存泄漏
可达性分析算法
- 通过判断对象的引用链是否可达来决定对象是否可以被收回
- 可以作为GC Root的对象
(1)虚拟机栈引用的对象(栈帧中的本地变量表)
(2)方法区中常量引用的对象
(3)方法区中类静态属性引用的对象
(4)本地方法栈JNI(Native方法)的引用对象
(5)活跃线程的引用对象
垃圾回收算法
- 标记-清除算法(Mark and Sweep)
- 标记:从根集合进行扫描,对存活的对象进行标记
- 清除:对堆内存从头到尾进行线性遍历,回收不可达对象内存
- 缺点: 造成内存碎片化
- 复制算法(Copying)
- 分为对象面和空闲面
- 对象在对象面创建
- 存活的对象被从对象面复制到空闲面
- 将对象面所有对象内存清除
- 解决碎片化问题
- 顺序分配内存,简单高效
- 适用于对象存活率低的场景
- 标记-整理算法(Compacting)
- 在标记-清除算法的基础上增加了整理模块,将存活的对象重新依次存入内存
- 避免内存的不连续行
- 不用设置两块内存互换
- 适用于对象存活率高的场景
- 分代收集算法(Generational Collector)
新生代,老生代,永久代/元空间
新生代(常用复制算法),老生代(常用标记-清理算法,标记-整理算法)是堆空间上的
永久代是方法区上的
简述
- 垃圾回收算法的组合拳
- 按照对象生命周期的不同划分区域,以采取不同的垃圾回收算法
优点
- 提高JVM的回收效率
GC的分类
- Minor GC:发生在新生代(生命周期短的对象,采用复制算法)
- Full GC:针对整个新生代、老生代、元空间(metaspace,java8以上版本取代perm gen)的全局范围的GC
- Full GC比Minor GC慢,但执行频率低
对象如何晋升到老年代
- 经历一定Minor次数依旧存活的对象
- Survivor区中存放不下的对象
- 新生成的大对象(-XX:+PretenuerSizeThreshold)
常用的调优参数
- -XX:SurvivorRatio:Eden和Survivor的比值,默认8:1
- -XX:NewRatio:老年代和新生代内存大小的比例
- -XX:MaxTenuringThreshold:对象从年轻代晋升到老年代经历GC次数的最大阙值
出发Full GC的条件
- 老年代空间不足
- 永久代空间不足(jdk8之前)
- 调用System.gc()
- Minor GC晋升到老年代的平均大小大于老年代的剩余空间
- CMS GC时出现promotion failed, concurrent mode failue
- 使用RMI来进行RPC或管理的JDK应用,每小时执行1次Full GC
Stop-the-World
- JVM由于执行GC而停止了应用程序的执行
- 任何一种GC算法中都会发生
- 多数GC优化通过减少Stop-the-world发生的时间来提高程序性能
Safepoint
- 分析过程中对象引用关系不会发生变化的点
- 产生Safepoint的地方:方法调用,循环跳转,异常跳转等
- 安全点数量得适中
常见的垃圾收集器
- JVM的运行模式
- Server:长期运行稳定后,比Client运行速度快(采用的重量级的虚拟机)
- Client:启动速度较快(轻量级的虚拟机)
- 垃圾收集器之间的联系
- Serial收集器(-XX:+UseSerialGC,复制算法)
- 单线程收集,进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的年轻代收集器
- ParNew收集器(-XX:+UseParNewGC,复制算法)
- 多线程收集,其余的行为,特点和Serial一样
- 单核执行效率不如Serial,在多核下执行才有优势
- Parallel Scavenge收集器(-XX:+UseParallelGC,复制算法)
- 比起关注用户线程停顿事件(交互速度),更关注系统的吞吐量
- 在多核下执行才有优势,Server模式下默认的年轻代收集器
- Serial Old收集器(-XX:+UseSerialOldGC,标记-整理算法)
- 单线程收集,进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的老年代收集器
- Parallel Old收集器(-XX:+UseParallelOldGC,标记-整理算法)
- 多线程,吞吐量优先
- CMS收集器(-XX:+UseConcMarkSweepGC,标记-清除算法)
Concurrent(并发) Mark Sweep
- 初始化标记:Stop-the-world(需要虚拟机停顿正在执行的任务,从垃圾回收的根对象开始,只扫描到能够与根对象直接关联的对象并做标记)
- 并发标记:并发追溯标记,程序不会停顿(在初始化标记的基础上继续深入)
- 并发预清理:查找执行并发标记阶段从年轻代晋升到老年代的对象(减少下一步时间)
- 重新标记:暂停虚拟机,扫描CMS堆中的剩余对象
- 并发清理:清理垃圾对象,程序不会停顿
- 并发重置:重置CMS收集器的数据结构
- 初始标记,重新标记人需要Stop the world
- 整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作
- 优点:并发收集,低停顿
- 缺点:内存空间碎片化
- G1收集器(-XX:+UseG1GC,复制 + 标记-整理算法)
- 既可以用于新生代,也可用于老年代
- 并发和并行
- 分代收集
- 空间整合
- 可预测的停顿
- 将整个java堆内存划分为多个大小相等的Region
- 新生代与老年代不再物理隔离
GC相关的面试题
- Object的finalize()方法的作用是否与C++的析构函数作用相同
finalize()
finalize()
- 与C++的析构函数不同,析构函数调用确定(即对象离开作用域后就会被释放),而它的是不确定的
- 将未被引用的对象放置于F-Queue队列
- 方法执行随时可能被终止
- 给予对象最后一次重生的机会
- 对象覆写了finalize()方法(这样在被判死后才会调用此方法,才有机会做最后的救赎)
- 用来做最后的资源回收,但其具有很大的不确定性,只能保证方法会调用,但不保证方法里的任务会被执行完,而且运行代价较高,一般不推荐也不建议重写Object的finalize()
两次标记:当垃圾回收器宣告一个对象死亡时,至少要经过两次的标记过程
- 当可达性分析确认该对象没有引用链与GC Roots相连,则对其进行第一次标记和筛选,筛选的条件是重写了finalize()方法并没有执行过,对于重写了且并没有执行finalize()方法的对象这将其放置在一个F-Queue队列中,并在稍后由一个由虚拟机自动建立的低优先级的Finalizer线程去执行它
- 在此之后,系统会对对象进行第二次标记,如果在第一次标记之后的对象在执行finalize()方法时没有被引用到一个新的变量,该对象将被回收掉
- 强引用,软引用,弱引用,虚引用
强引用:
- 最普遍的应用:Object obj = new Object()
- 抛出OutOfMemoryError终止程序也不会回收具有强引用的对象
- 通过将对象设置为null来弱化引用,使其被回收
软引用:
- String str = new String(“abc”);
SoftReference< String > sofrRef = new SoftReference< String >(str);- 对象处在有用但非必须的状态
- 只有当内存空间不足时,GC会回收该引用的对象的内存
- 可以用来实现高速缓存
弱引用:
- String str = new String(“abc”);
WeakReference< String > weakRef = new WeakReference< String >(str);- 非必须的对象,比软引用更弱一些
- GC时被回收
- 被回收的概率也不大,因为GC线程优先级比较低
- 适用于引用偶尔被使用且不影响垃圾收集的对象
虚引用:
- String str = new String(“abc”);
ReferenceQueue queue = new ReferenceQueue();
PhantomReference ref = new PhantomReference(str, queue);- 不会决定对象的生命周期
- 任何时候都可能被垃圾收集器回收
- 跟踪对象被垃圾收集器回收的活动,起哨兵的作用
- 必须和引用队列ReferenceQueue联合使用
引用队列:
- 无实际存储结构,存储逻辑依赖于内部节点之间的关系来表达
- 存储关联的且被GC的软引用,弱引用以及虚引用
- 当GC释放对象内存的时候,会将其引用加入到引用队列,相当于是一种通知机制,程序可以通过判断引用队列中是否已经加入了引用,来了解被引用的对象是否被GC回收