1.定义
GC :Garbage Collections ,即JVM垃圾收集器,垃圾回收其实就是对那些“死亡的”对象进行其所侵占的内存的释放,让后续对象再能分配到内存,从而完成程序运行的需要。
回收的场所为堆、方法区,在堆中进行垃圾回收分为新生代(Young Generation)和老年代(Old Generation)。
新生区又分为:Eden区(Eden Region)、From Survivor区(Form Survivor Region)以及To Survivor(To Survivor Region)。
回收的类型分为minorGC、fullGC。
2.回收策略
minorGC:频繁的收集新生区
- 新生区的Eden区已满无法再创建对象时(Survivor满不会触发GC),会触发minorGC来收集无有效引用的对象,如果此时幸存区from区为空时,将剩余存活的对象放到from区,如果Eden区再次满了时,minorGC会将Eden区和From Survivor区中无效引用的对象回收,将剩余的对象放入幸存区的To Survivor区,然后交换幸存区的From区和To区,每次minorGC回收时,会记录对象的存活次数,当To区满了时,minorGC会将存活次数超过15次的对象放入养老区,该值可调整。
参数: -XX:MaxTenuringThreshold — 设置对象在新生代中存活的次数,默认15次
fullGC:较少的收集养老区
- 当养老区满了无法创建对象时,fullGC即全局GC会来回收无有效引用的对象,
- 当永久代满时也会触发fullGC,会导致Class、Method元信息的卸载
3.回收标准(对象存活判断算法)
- 给对象赋null且不再使用
- 给对象赋新值,已重新分配内存
引用计数法
给对象添加一个引用计数器,当有一个地方引用它时,计数器值就加1;当引用失效时,计数器就减1;任何时候计数器都为0的对象就是不可能再被使用的
缺点:
很难解决对象之间相互引用的问题
如下代码中myObject1和myObject2其实互相引用,他们的引用计数都为1,但是本身都是null,如果用引用计数法因为计数为1不会被GC回收,但他们本身为null,最终导致内存泄漏
public class MyObject {
public Object ref = null;
public static void main(String[] args) {
MyObject myObject1 = new MyObject();
MyObject myObject2 = new MyObject();
myObject1.ref = myObject2;
myObject2.ref = myObject1;
myObject1 = null;
myObject2 = null;
}
}
可达性分析法(根搜索算法)
通过一系列的称为“GC roots”的对象作为起始点,从这些节点,开始向下搜索,搜索所走过的路径称为引用链,当一个对象到 GC root 没有任何引用链相连(用图论的话来说,就是从 GC roots 到这个对象不可达),则证明此对象是不可用的
- 可以作为"GC roots"的对象
1)虚拟机栈中应用对象
2)方法区中类静态属性的引用
3)方法区中常量的引用对象
4)本地方法栈中的引用对象
4.流程-生成新对象,内存申请
- jvm先尝试在eden区分配新建对象所需的内存
- 如果内存大小足够,申请结束,否则下一步
- jvm启动新生代GC,试图将eden区中不活跃的对象释放掉,释放后若Eden空间仍然不足以放入新对象,则试图将部分Eden中活跃对象放入Survivor区
- Survivor区被用来作为Eden及old的中间交换区域,当OLD区空间足够时,Survivor区的对象会被移到Old区,否则会被保留在Survivor区
- 当OLD区空间不够时,JVM会在OLD区进行full GC
- full GC后,若Survivor及OLD区仍然无法存放从Eden复制过来的部分对象,导致JVM无法在Eden区为新对象创建内存区域,则出现”out of memory错误”
5.回收条件
MinorGC:
当Eden区满了之后,触发MinorGCFullGC:
- 调用System.gc(),系统建议执行Full GC,但是不必然执行
- 老年代空间不足
- 方法区空间不足
- 通过MinorGC后进入老年代所需的内存大于老年代可用的内存
- 当由Eden区和from区向to区复制幸存对象时,所需的内存大于to区的可用内存,则把此次复制的幸存对象转移到老年代中,当老年代剩余的空间不足以存储这些转移对象时,会触发FullGC
6.回收算法
复制算法(Copying):
新生代通常存活时间较短基于Copying算法进行回收
,所谓Copying算法就是扫描出存活的对象,并复制到一块新的完全未使用的空间中,对应于新生代,就是在Eden和FromSpace或ToSpace之间copy。新生代采用空闲指针的方式来控制GC触发,指针保持最后一个分配的对象在新生代区间的位置,当有新的对象要分配内存时,用于检查空间是否足够,不够就触发GC。当连续分配对象时,对象会逐渐从Eden到Survivor,最后到老年代。
- 位置:发生在新生代的Eden和FromSpace或ToSpace之间copy,新生区分为伊甸园(Eden)、幸存1区(from)、幸存2区(to),所占的内存比例为8:1:1
- 思想:将内存分为2块,每次只用一块,当一块用完时会将幸存的对象移动到另一块内存上
- 优点:不会产生内存碎片
- 缺点:浪费内存,适用于存活率不多的,需频繁操作应用
标记-清除算法(Mark-Sweep)
标记-清除算法分为两个阶段:标记阶段和清除阶段。标记阶段的任务是标记出所有需要被回收的对象,清除阶段就是回收被标记的对象所占用的空间。
- 位置:发生在JVM虚拟机的老年代中
- 思想:先将有效指引的对象标记,再清除未标记的对象
- 优点:相比复制算法来说不良费内存
- 缺点:效率低(因为要遍历扫描2次),会产生内存碎片(清除后的内存是不连续的)
标记-整理算法(Mark-Sweep)
为了解决Copying算法的缺陷,充分利用内存空间,提出了Mark-Compact算法。该算法标记阶段和Mark-Sweep一样,但是在完成标记之后,它不是直接清理可回收对象,而是将存活对象都向一端移动,然后清理掉端边界以外的内存。
- 位置:发生在JVM虚拟机的老年代中
- 思想:将标记的对象连续的放到一端,将未标记的对象放到另一端,然后将未标记的对象清除
- 优点:与标记/清除算法比,内存是连续的,与复制算法比不良费内存
- 缺点:效率比复制算法低,需要多维持一个链表,用于使幸存的对象连续
分代收集算法(Generational Collection)
一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或“标记-整理”算法来进行回收。
6.内存溢出和内存泄漏
OutOfMemoryException 内存溢出:
- 原因:
程序要求的内存超出了系统能分配的范围- 条件:
1)JVM98%的时间都花费在内存回收
2)每次回收的内存小于2%
并不是内存被耗空时触发,而是满足这两个条件将触发OutOfMemoryException,这将会留给系统一个微小的间隙以做一些Down之前的操作,比如手动打印Heap Dump- 场景:
1)堆内存溢出(OutOfMemoryError)的例子:申请了很多内存,没释放,如创建了大量的实例引用类型
2)方法区内存溢出,是类信息、常量、静态变量等。所以如果程序加载的类过多,或者使用反射、cglib等这种动态代理生成类的技术,就可能导致该区发生内存溢出
3)线程栈溢出,程栈时线程独有的一块内存结构,所以线程栈发生问题必定是某个线程运行时产生的错误。 一般线程栈溢出是由于递归太深或方法调用层级过多导致的
Memory leak 内存泄漏:
- 原因:
分配出去的内存无法回收- 场景:
1)长生命周期的对象持有短生命周期对象的引用,即静态集合类。例如:在static HashMap中缓存局部变量,且没清空,随时间的推移,这个map会越来越大,造成内存泄露
2)变量不合理的作用域
3)没有及时将对象设置为null
4)各种连接没有显式关闭,如数据库连接、网络连接、i/o连接
5)释放对象时没有删除监听器- 优化:
1)尽早释放无用对象的引用
2)使用字符串处理,避免使用String,使用StringBUilder或使用StringBuff
3)尽量少的使用静态变量,静态变量存放在永久代
4)避免在循环中创建对象
5)开启大型文件或从数据库中拿了太多的数据