1.运行时数据区域
1.1.1.程序计数器
程序计数器( Program Counter Register)是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。
是线程私有的
是唯一一个在Java虚拟机规范中没有规定任何 OutOfMemory Error情况的区域
1.1.2.Java虚拟机栈
Java虚拟机栈( Java Virtual Machine Stacks)是线程私有的,它的生命周期与线程相同。
每个方法被执行的时候都会同时创建一个栈帧( Stack Frameφ)用于存储局部变量表、操作栈、动态链接、方法出口等信息。
每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型、对象引用和 returnAddress类型
在Java虛拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虛拟机所允许的深度,将抛出 Stack Overflow Error异常;如果虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出 OutOfMemoryError异常
1.1.3.本地方法栈
本地方法栈( Native Method Stacks)与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的 Native方法服务。
1.1.4.Java堆
Java堆( Java Heap)是Java虚拟机所管理的内存中最大的一块,堆是线程共享的,在虚拟机启动时创建。
堆分为新生代和老年代。新生代又分为Eden和两个survivor。
如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemory Error异常。
1.1.5.方法区
方法区( Method area)是线程共享的,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
当方法区无法满足内存分配需求时,将抛出OutOfMemory Error异常。
运行时常量池( Runtime Constant Pool)是方法区的一部分,用于存放编译期生成的各种字面量和符号引用,当常量池无法再申请到内存时会抛出 OutofMemory Error异常。
2.对象的访问
Object obj= new Object();
假设这句代码出现在方法体中。等号前的语义将会反映到Java栈的局部变量表中,作为一个 reference类型数据出现。等号后的语义将会反映到Java堆中,形成一块存储了 Object类型所有实例数据值的结构化内存。在Java堆中还必须包含能査找到此对象类型数据(如对象类型、父类、实现的接口、方法等)的地址信息,这些类型数据则存储在方法区中。
对象的访问方式:使用句柄和直接指针
如果使用句柄访问方式,Java堆中将会划分出一块内存来作为句柄池, reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自的具体地址信息。
如果使用直接指针访问方式,Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息, reference中直接存储的就是对象地址。
3.垃圾收集
3.1.判断时象存活算法
- 引用计数算法
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1:当引用失效时,计数器值就减1;任何时刻计数器都为0的对象就是不可能再被使用的。
引发的问题:对象之间的相互循环引用 - 根搜索算法
通过一系列的名为“ GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链当一个对象到 GC Roots没有任何引用链相连时,则证明此对象是不可用的。
GC Roots对象:
虚拟机栈 栈帧中的本地变量表中引用的对象。
方法区中的类静态属性引用的对象
方法区中的常量引用的对象。
本地方法栈中Native方法的引用的对象。
3.2.引用
引用分为强引用( Strong Reference)、软引用( Soft reference)、弱引用( Weak Reference)、虚引用( Phantom Reference)四种,这四种引用强度依次逐渐减弱。
1.强引用就是指在程序代码之中普遍存在的,类似“ Object obj= new Object ()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
2.软引用用来描述一些还有用,但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。
3.弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。
4.虚引用最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知。
3.3.垃圾收集算法
- 标记一清除算法
算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。
它的主要缺点有两个:一个是效率问题,标记和清除过程的效率都不高;另外一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。 - 复制算法
复制算法将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
主要用来回收新生代。将内存分为一块较大的Eden空间和两块较小的 Survivor空间,每次使用Eden和其中的块 Survivor当回收时,将Eden和 Survivor中还存活着的对象一次性地拷贝到另外块 Survivor空间上,最后清理掉Eden和刚才用过的 Survivor的空间。 - 标记一整理算法
首先标记出所有需要回收的对象,然后将所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存 - 分代收集算法
根据对象的存活周期的不同将内存划分为几块。是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,毎次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记一清理”或“标记一整理”算法来进行回收。
3.3.垃圾收集器
3.3.1.Serial收集器
Serial收集器是单线程的收集器,它进行垃圾收集时,必须暂停其他所有的工作线程直到它收集结束。
Serial收集器简单而高效,对于限定单个CPU的环境来说, Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。主要运行在Client模式下的虚拟机。
Serial能与Serial Old 、CMS配合使用
3.3.2.ParNew收集器
ParNew收集器是 Serial收集器的多线程版本。主要运行在Server模式下。
ParNew能与Serial Old 、CMS配合使用
3.3.3.Parallel(pærəlel) Scavenge(ˈskævɪndʒ)收集器
Parallel Scavenge收集器也是一个新生代收集器,使用复制算法的收集器,也是并行的多线程收集器。 Parallel Scavenge收集器也叫“吞吐量优先”收集器。主要适合使用在后台运算而不需要太多交互的任务。
Parallel Scavenge 能与Serial Old 、Parallel Old配合使用
3.3.4.Serial Old收集器
Serial old是 Serial收集器的老年代版本,它同样是一个单线程收集器,使用“标记二整理”算法。这个收集器的主要意义也是被 Client模式下的虚拟机使用。
记二整理”算法。这个收集器的主要意义也是被 Client模式下的虚拟机使用。如果在 Server模式下,它主要还有两大用途:一个是在JDK1.5及之前的版本中与 Parallel Scavenge收集器搭配使用,另外一个就是作为CMS收集器的后备预案,在并发收集发生 Concurrent Mode Failure的时候使用。
Serial Old能与 Serial、ParNew和Parallel Scavenge配合使用
3.3.5.Parallel old收集器
Parallel old是 Parallel Scavenge收集器的老年代版本,使用多线程和“标记一整理”
算法。
Parallel old只能和Parallel Scavenge配合使用
3.3.6.CMS收集器
CMS能与Serial、ParNew配合使用
CMS( Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。主要用于Java应用都集中在互联网站或B/S系统的服务端上,CMS使用标记-清除算法
过程包括:初始标记、并发标记、重新标记、并发清除。
初始标记、重新标记这两个步骤仍然需要暂停其他所有的工作线程。初始标记仅仅只是标记一下 GC Roots能直接关联到的对象,并发标记阶段就是进行GC Roots Tracing(根搜索算法)的过程,而重新标记阶段则是为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录。
缺点:
1.CMS收集器对CPU资源非常敏感。面向并发设计的程序都对CPU资源比较敏感。在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用了一部分线程(或者说CPU资源)而导致应用程序变慢,总吞吐量会降低。
2.CMS收集器无法处理浮动垃圾,可能出现“ Concurrent Mode Failure”失败而导致另一次 Full gc的产生。
- 由于CMS并发清理阶段用户线程还在运行着,伴随程序的运行自然还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在本次收集中处理掉它们,只好留待下一次GC时再将其清理掉。这一部分垃圾就称为“浮动垃圾”。
也是由于在垃圾收集阶段用户线程还需要运行,即还需要预留足够的内存空间给用户线程使用,要是CMS运行期间预留的内存无法满足程序需要,就会出现一次“ Concurrent Mode failure”失败,这时候虚拟机将启动后备预案:临时启用 Serial Old收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。
3.CMS采用标记-清除算法,收集结束时会产生大量空间碎片。空间碎片过多时,将会给大对象分配带来很大的麻烦,往往会出现老年代还有很大的空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发一次 Full GC。
3.3.7.G1收集器
G1收集器是基于“标记一整理”算法实现的收集器,所以不会产生空间碎片。G1收集器
G1收集器可以非常精确地控制停顿,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。G1将整个Java堆(包括新生代、老年代)划分为多个大小固定的独立区域,并且跟踪这些区域里面的垃圾堆积程度,在后台维护一个优先列表,每次根据允许的收集时间,优先回收垃圾最多的区域(这就是 Garbage First名称的来由)。
内存分配策略
- 对象优先在Eden分配
大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够的空间进行分配时,虚拟机将发起一次 Minor GC. - 大对象直接进入老年代
大对象是指需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串及数组。 - 长期存活的对象将进入老年代
虚拟机给每个对象定义了一个年龄计数器,对象在新生代中每经过一次Minor GC年龄就增加一岁。当年龄到达阈值就会晋升到老年代中 - 动态对象年龄判定
如果Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无需等到阈值中的要求 - 空间分配担保
空间分配担保是指Survivor无法容纳的对象直接进入老年代。
在发生 Minor gc时,虚拟机会检测之前每次晋升到老年代的平均大小是否大于老年代的剩余空间大小,如果大于,则改为直接进行一次 Full go。如果小于,则查看Handle Promotion Failure设置是否允许担保失败;如果允许,那只会进行 Minor gc:如果不允许,则也要改为进行一次 Full GC。
担保的前提是有足够的空间容纳存活下来的对象,但在GC之前无法知道存活对象的空间大小,所以只好取之前每一次回收晋升到老年代对象容量的平均大小值作为经验值,与老年代的剩余空间进行比较。
Minor GC和 Full GC的区别
新生代GC( Minor gc):指发生在新生代的垃圾收集动作,因为Java对象大多都具备朝生夕灭的特性,所以 Minor gc非常频繁,一般回收速度也比较快。
老年代GC( Major GC/ Full go):指发生在老年代的GC,出现了 Major GC,经常会伴随至少一次的 Minor gc(但非绝对的,在 ParallelScavenge收集器的收集策略里就有直接进行 Major GO的策略选择过程)。 Major CA的速度一般会比 Minor gc慢10倍。