1.什么是垃圾
没有任何引用指向的一个对象或者多个对象(循环引用)
2 如何定位垃圾
2.1引用计数(ReferenceCount)
在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,引用失效时就减1.任何时刻计数器为0的对象就是不可能再被使用的。这个方法效率挺高,大部分情况下也是很不错的算法。
但是在JVM中会很难解决对象之间相互循环引用的问题,就如果两个对象之间相互调用,这时候就会发生类似死锁的情况,即这个地方相互调用会使得引用计数法始终认为有对象在引用当前对象,就一直计数值大于或等于1,也就无法通知GC收集器回收它们。但是实际的情况是这两个对象后面已经不再调用,所以这个方法虽然简单高效,但不是我们的首选。虚拟机也不是通过这个算法来判断对象是否存活的。
2.2根可达算法(RootSearching)
使用一系列的GC Roots的对象(包括:虚拟机栈中引用的对象,方法区中类静态属性引用的对象,方法区中常量引用的对象,本地方法栈中JNI引用的对象)作为起点,从节点开始向下搜索,当没有被GCRoots链接到的对象就可以回收,如下图的对象4和5就判断为可回收对象。
在JDK1.2之后,Java对引用这个概念进行了扩充,也就是对象不仅仅只有引用和没有引用两个概念,而是扩展到了4个:
强引用:类似于“Object obj=new Object()”只要强引用在,垃圾收集器永远不会回收掉被引用的对象。
软引用:是用来描述一些还有用但是并非必需的对象,对于软引用对象,在内存溢出异常之前,会把这些对象列进回收范围之中进行第二次回收。
弱引用,比软引用更弱一点,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集发生时无论内存是否足够,都会只回收弱引用的对象。
虚引用,最弱的引用关系,对象是否有虚引用对其生存时间是没有影响的。唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
对象要想真正宣告“死亡”需要至少两次的标记过程,当对象在可达性分析时候发现没有被GC Roots链到那么对象就会进行第一次标记并且进行第一次筛选,筛选的条件就是判断该对象有没有必要执行finalize()方法,需要执行的话就会把对象放入F-Queue的对列中去执行该对象中的finalize()方法。如果finalize()方法让对象重新被GC Roots链到那么对象就重新活下来,否则就会进行第二次标记,等待垃圾回收的到来
3常见的垃圾回收算法
3.1 复制算法 (copying) - 没有碎片,浪费空间
它将可用内存空间划分为一块较大的Eden空间和两块较小的From Survivor(S0)和To Survivor(S1)空间。每次使用时只使用Eden和其中一块S区。比如这次使用的是S0区。回收时将Eden和S0区中的中还存活的对象一次性复制到S1中最后再清理Eden和S0中的对象,HotSpot虚拟机默认Eden:S0:S1之间大小比例是8:1:1,这是因为新生代中对象大多数甚至98%的都是“朝生夕死”。如果S区的大小不够那么就会依赖老年代的内存进行分配担保
3.2标记清除(mark sweep) - 位置不连续 产生碎片 效率偏低(两遍扫描)
首先标记出所有需要回收的对象,在标记完成之后统一回收所有标记的对象
3.3 标记压缩/整理(mark compact) - 没有碎片,效率偏低(两遍扫描,指针需要调整)
先标记所有可回收对象,让存活的对象向一端移动,然后直接清理掉端边界以外的内存
在老年代中因为对象存活率高,没有额外的空间对它进行分配担保,所以会采用标记—清理或标记—整理算法来进行回收对象
如下图:
红色:垃圾对象
绿色:非垃圾对象
白色:可用内存
对象从新生代变成老年代的判定方法
每经历一次Minor GC(复制算法回收对象)就会让对象的年龄加一,当对象年龄为15时就会把新生代的对象放入老年代中。
如果Survivor区中的存放不下的对象就会放入老年代中:对象会优先在Eden区中分配,而后通过一次Minor GC就让对象进入Survivor区中,当Survivor区中存放不下该对象时就会将该对象放入老年代。
新生成的大对象也会直接放入老年代中(可以通过-XX:+PretenuerSizeThreshold设置)超过这个size的对象一生成就会放入老年代。
4.JVM内存分代模型(用于分代垃圾回收算法)
4.1 部分垃圾回收器使用的模型
> 除Epsilon ZGC Shenandoah之外的GC都是使用逻辑分代模型
> G1是逻辑分代,物理不分代
> 除此之外不仅逻辑分代,而且物理分代
4.2JVM中,将对象在内存中分为了三代:
新生代和老年代的默认比例大小是1:2
- 年轻代:很快被回收的对象,存在于堆,具体还在内存中分为了1个eden区,和2个survivor区。
- 老年代:长期存在的对象,存在于堆
- 永久代:指的就是方法区(存放Class元数据),回收条件较苛刻,需满足:该类所有实例对象所有已经从堆内存被回收,该类classLoader已经被回收,该类Class对象没有任何引用
4.3 年轻代
大部分对象刚创建的时候都会分配在年轻代的Eden区,只要年轻代空间不够就会触发MinorGC(只回收年轻代内存),minorGC采取复制算法进行回收,当JVM运行触发第一轮minorGC时,会将eden区存活的对象先复制到一个suprivor区。然后删除eden区对象,当触发下一轮minorGC时,又把suprivor区和eden区的存活的对象转移到另一个suprivor区,然后删除这两个区的所有对象。依次类推。至于为什么要用复制算法,包括老年代的标记整理算法,这是考虑到了避免内存碎片。如果对象内存不连续,会造成很多的空间浪费。
4.4 老年代
老年代的对象都是从年轻代根据一定的规则流转过来的。 具体有几类流转方式:
超过指定年龄(参数-XX:MaxTenuringThreshold 配置,默认15),这里年龄指的是没有被垃圾回收,存活下来一次理解为增加一岁。流转到老年代。
大对象直接进入,超过参数指定字节数(-XX:PretenureSizeThreshold)设置的字节数的大对象会直接进入老年代,这是因为对象越大,复制开销就越大。
动态年龄判断规则进入,意思是不一定要到指定年龄再流转到15,如果某一年龄以上的对象到达一定大小,也会提前进入老年代。当躲过一轮GC的对象加起来超过surrvivor区50%,如年龄1+年龄2+年龄n一直累加,直到年龄n的时候发现加起来超过了surrvivor空间的50%,则年龄n以上的对象直接进入老年代.
minorGC发生时,suprivor区放不下,超过的部分转移到老年代。这里涉及一个老年代分配担保规则,指的是每次MinorGC发生时,都会判断老年代可用内存大不大于,年轻代存活对象内存之和,如果大于则直接进行minorGC,如果小于则要看参数XX:HandlePromotionFailure是否启用(默认启用),如果启用则对老年代这次需要承载的转移对象内存进行预估(取前面minorGC被转移的平均内存大小),若大于则也进行MinorGC,若意料状况外转移内存超出了老年代可用空间,则进行FullGC,若fullGC还是不够,则抛出OOM错误。FullGC是采取的标记整理算法,指的是移动存活对象,让内存连续,然后删除需要回收的对象,为什么使用标记整理?因为认为老年代对象存活几率高,复制算法不划算。
4.5 永久代
永久代存放的是元数据信息,当类加载时,类元数据信息写入永久代,fullGC时永久代数据被回收,回收条件是:该类所有实例对象所有已经从堆内存被回收,该类classLoader已经被回收,该类Class对象没有任何引用。
附加一个对象的分配图: