判断一个对象是否能被回收有两种方式:
- 引用计数算法:给对象添加一个引用计数器,每当有地方引用它时,计数器加1;当引用失效时,计数器减1。任何时刻计数器为0的对象就是不能再被使用的。(它无法解决对象之间循环引用的问题。)
- 可达性分析算法:在主流的程序语言的实现中,都是通过可达性分析来判断对象是否存活。这个算法的基本思想就是通过一系列的“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索过的路径为引用链,当一个对象到GC Roots没有任何引用链相连时,说明这个对象不可用。
在Java语言中,可作GC Roots的对象包括以下几种:
- 虚拟机栈中引用的对象。
- 方法区中静态属性引用的对象。
- 方法区中常量引用的对象。
- 本地方法中JNI(Native方法)引用的对象。
垃圾收集算法
1.标记-清除算法
“标记-清除”算法分“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象,它的标记过程就是可达性分析,如果在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机都会视为“没有必要执行”,需要注意的是finalize方法只能执行一次,所以在第二次进行标记时如果这个对象还是不可达的那它基本上就真的被回收了。
“标记-清除”算法是最基础的收集算法,因为后续的算法都是基于这种思路并进行改进。它主要有两个不足:一个是效率问题:标记和清除两个过程效率都不高;另一个是空间问题,标记清除后会产生大量不连续的内存碎片,空间碎片太多会导致后续程序需要分配较大对象时无法找到足够的连续内存而不得不提前触发一次垃圾收集动作。
2.复制算法
为了解决效率问题,复制算法将内存按容量划分为大小相同的两块,每次只用其中一块。当这块内存使用完了就将还存活的对象复制到另一块上面,然后将已使用过的内存空间一次清理掉。这使得每次都是对整个半区进行内存回收,内存分配时就不需要考虑内存碎片等复杂情况,只要移动堆顶指针按顺序分配内存即可。缺点是这种算法将内存缩小为原来的一半。
这种算法常用来回收新生代。新生代的对象大部分都是“朝生夕死”,所以不需要1:1的比例来划分内存空间,而是将内存分为一块将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。在HotSpot虚拟机中默认Eden和Survivor的比例为8:1,也就是说每次新生代中可用的内存空间为整个新生代容量的90%,只有10%才会被良妃。当Survivor空间不够用时,需要依赖其他内存(老年代)进行分配担保。
3.标记整理算法
复制收集算法在对象存活率较高时就会要进行较多次的复制操作,会使效率变低。在处理对象都100%存活的极端情况时它浪费的50%的空间就会很多余,所以在老年代中一般不能直接使用这种算法。
“标记-整理”算法过程跟“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的的对象向一端移动,然后直接清理掉边界外的内存。
4.分代收集算法
目前商业虚拟机的垃圾收集都是采用“分代收集”算法,它根据对象的存活周期将内存划分为几块。一般在新生代中,每次垃圾收集都有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就能完成收集。而老年代因为对象存活率高、没有额外空间对其进行分配担保,就必须使用“标记清理”或者“标记整理”算法来进行回收。
参考《深入理解Java虚拟机与最佳实践》