判断对象是否死亡的方法
1)引用计数算法
给对象添加一个引用计数器,每当一个地方引用它时,计数器加1,当引用失效,计数器减1,任何时刻计数器为0的对象就是不可能再被使用。然而主流的Java虚拟机里面没有选用引用计数算法来管理内存,因为无法解决对象之间相互循环引用的问题。
2)可达性分析算法
以一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,此对象不可用。
可作为GC Roots的对象如下:
- 虚拟机栈(栈帧中的本地变量表)中的引用对象
- 方法区中类静态属性引用的对象
- 方法区中引用常量的对象
- 本地方法栈中JNI(一般说Native方法)引用的对象
强引用、软引用、弱引用、虚引用
1)强引用:类似“Object obj = new Object()”这类引用,只要强引用还在,GC就不会回收对象。
2)软引用:用来描述一些还有用但非必需的对象。软引用关联的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。
3)弱引用:用来描述非必需的对象。被弱引用关联的对象只能生存到下一次GC之前,GC时无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
4)虚引用:虚引用唯一的目的就是能在这个对象被收集器回收时收到一个系统通知。
回收方法区
永久代回收两部分内容:废弃常量和无用的类。
1)回收废弃常量与回收Java堆中的对象类似,当没地方引用这个字面量且有必要发生内存回收的,则回收这个字面量。
2)回收无用的类需要同时满足3个条件:
- 该类所有的实例都已经被回收,Java堆中不存在该类的任何实例。
- 加载该类的ClassLoader已经被回收。
- 该类对应的java.lang.Class对象没有再任何地方被引用,无法在任何地方通过反射访问该类的方法。
垃圾收集算法
标记-清除算法
具体过程不讲,有两个缺点:
1)效率问题,标记和清除两个过程效率都不高。
2)标记清除之后会产生大量不连续的内存碎片,碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
复制算法(新生代算法)
将内存容量划分为大小相等的两块,每次只用一块,当这一块内存用完了,就将还存活的对象复制到另一块上,然后把已使用的内存空间一次清理掉。缺点是把内存缩小为原来的一半,代价太高。
所以这种算法用来回收新生代,由于新生代的对象98%是“朝生夕死”的,所以内存比例不用按1:1划分,通常划分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden区和一块Survivor,回收时,将Eden区和Survivor区中还存活的对象一次性复制到另外一块Survivor上。当Survivor空间不够时,需要依赖其他内存进行担保分配。
标记-整理算法(老年代算法)
老年代的对象存活率较高,复制操作效率会变低,可能需要应对对象100%存活的情况,所以不适用复制算法。所以提出了“标记-整理”算法。
“标记-整理”算法过程与“标记-清除”算法一致,但后续步骤不是直接对可回收对象进行清理,而是让所以存活对象都向一段移动,然后直接清理掉端边界以外的内存。
垃圾收集器
CMS收集器(老年代收集器)
CMS收集器以获取最短回收停顿时间为目标,基于“标记-清除”算法,分初始标记、并发标记、重新标记、并发清除四个阶段。
- 初始标记、重新标记需要stop the world。
- 初始标记仅仅是标记下GC Roots能直接关联到的对象,速度很快。
- 并发标记就是进行GC Roots Tracing的过程。
- 重新标记是为了修正并发标记期间因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,停顿时间比初始标记要长,比并发标记短。
CMS的优点是并发收集、低停顿,也有三个缺点:
- CMS收集器对CPU资源非常敏感。
- 无法收集“浮动垃圾”。在并发清理阶段用户线程还在运行,还会有新的垃圾不断产生,这部分垃圾在此次标记之后,无法在这次收集中清理,这部分是“浮动垃圾”。CMS不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,需要预留足够的线程给用户使用,保守估计,当老年代使用了68%之后CMS收集器就会被激活。当预留的内存无法程序需要,就会出现“Concurrent Mode Failure”失败,这时虚拟机将会临时启用Serial Old收集器来重新进行老年代的垃圾收集。
- 最后一个缺点,是“标记-清除”算法的缺点,会有大量空间碎片。
G1收集器(新生代老年代都可回收)
当今收集器技术发展的最前沿成果之一,其使命是替换CMS收集器。G1具有以下特点:
- 并行与并发:充分利用多CPU、多核环境下的硬件优势,来缩短Stop-The-World停顿的时间。
- 分代收集:不需要其他收集器配合就能独立管理整个GC堆。
- 空间整合:整体基于“标记-整理”算法,局部基于复制算法,不会产生内存空间碎片。
- 可停顿的预测:能让使用者指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集的时间上不得超过N毫秒。
G1收集时,Java堆内存布局与其他收集器有很大差别,他将Java堆分为多个大小相等的独立区域(Region),不再有新生代老年代的概念。G1跟踪各个Region里面的垃圾堆积的价值(回收所获的空间大小以及回收所需时间的经验值),在后天维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。
如何避免全堆扫描
对于Region之间的对象引用以及其他收集器中新生代和老年代之间的对象引用,虚拟机使用Remembered Set来避免全堆扫描的。Region中被外面引用的对象的相关引用信息记录到Remembered Set 中,在进行回收时,在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。
G1收集运作步骤
- 初始标记:仅仅标记GC Roots能直接关联到的对象,并且修改TAMS(Next Top at Mark Start)的值,好让下一阶段用户并运行时,能在正确的可用的Region中创建新对象。需要线程停顿,耗时短。
- 并发标记:可达性分析,找出存活对象,耗时长,可与用户程序并发执行。
- 最终标记:并发标记时会把用户程序继续运行而导致的标记变化的记录记录在Remembered Set Logs中,最终标记会把这部分日志整合在Remembered Set中。
- 筛选回收:先对各个Region的回收价值和成本进行排序,然后根据用户期待的GC停顿时间来指定回收计划。
几条最普遍的内存分配规则
1)对象优先分配在Eden。当Eden区没有足够的空间进行分配时,虚拟机进行一次MinorGC。若有对象无法放在Survivor空间,只好通过分配担保机制提前转移到老年代去。
2)大对象直接进入老年代。大对象指的是需要大量连续内存空间的Java对象,典型的是很长的字符串及数组。
3)长期存活的对象将进入老年代。
虚拟机给每个对象定义了一个年龄计数器:
- 对象在Eden出生并经过第一次MinorGC后仍然存活,并能被Survivor容忍的话,将被移动到Survivor空间中,并且对象年龄设为1。
- 在Survivor每熬过一次MinorGC,年龄增加1岁。
- 当年龄增加到一定程度(默认15岁),就会晋升到老年代。
4)动态对象年龄判定。不是所有对象达到默认阈值才能晋升到老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,则年龄大于或等于该年龄的对象就可以直接进入老年代。