目录
对于Java程序员来说,在虚拟机自动内存管理机制的帮助下,不再需要为每一个new操作去写配对的delete/free代码,不容易出现内存泄露和内存溢出问题。不过,一旦出现内存泄露和内存溢出方面的问题,如果不了解虚拟机是怎样使用内存的,那么排查错误将会成为一项艰难的工作。
1.JVM内存模型
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分成若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域伴随着虚拟机进程的启动而存在,有的区域则依赖于用户线程的启动和结束而建立和销毁。Java虚拟机所管理的内存将会包括以下几个运行时数据区域:
JVM调优主要是调堆,很少会调方法区,不需要调栈。
1.1 程序计数器
程序计数器是一块较小的内存区域,它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一个需要执行的字节码指令,循环、跳转、异常处理、线程恢复等功能都是依赖于这个计数器完成。
在多线程的环境中,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。如果线程正在执行的是一个Java方法,程序计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Native方法,这个计数器则为空。此内存区域是唯一一个没有OutOfMemoryError情况的区域。
1.2 Java虚拟机栈
与程序计数器一样,Java虚拟机栈也是线程私有的,它的生命周期与线程相同。Java虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用直到执行完成的过程,就对应着一个栈帧在虚拟机中入栈到出栈的过程。而我们经常所说的栈指的是虚拟机栈中的局部变量表部分。
局部变量表存放了编译期可知的各种基本数据类型、对象引用。其中64位长度的long和double类型的数据会占用两个局部变量空间,其余的数据类型只占用1个。局部变量表所需要的内存空间在编译期间完成分配,当进入一个方法时这个方法需要在栈帧分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
这个区域中会出现两种异常:如果线程请求的栈深度大于虚拟机所需要的深度,将抛出StackOverflowError异常;如果虚拟机栈扩展时无法申请足够的内存,就会抛出OutOfMemoryError异常。
1.3 本地方法栈
本地方法栈与虚拟机栈所发挥的作用是非常类似的,它们的区别不过是虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则为虚拟机使用到的Native方法服务。HotSpot虚拟机直接把本地方法栈和虚拟机栈合二为一,与虚拟机栈一样,本地方法栈区域也会抛出StackOverflow和OutOfMemoryError异常。
1.4 Java堆
Java堆是Java虚拟机所管理的内存区域中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例。
Java堆是垃圾收集器管理的主要区域,从内存回收的角度来看,Java堆还可以细分成:新生代和老年代,再细致一点,可以分成Eden空间、From Survivor空间和To Survivor空间等,Java堆可以处于物理上不连续的内存空间中,只要逻辑上连续即可。Java堆使用-Xms和-Xmx来进行控制。如果堆中没有内存完成实例分配,并且堆也无法再进行扩展时,将会抛出OutOfMemoryError异常。我们可以增加参数 -XX:+HeapDumpOnOutOfMemaryError,当出现OOM异常时打印出dump日志进行快速的分析定位。
注意:内存满了爆出的是Error异常,try...catch...是无法捕获的
获取当前堆的最小堆(-Xms)和最大堆(-Xmx)的值:
public class HeapTest {
public static void main(String[] args) {
long maxMemory = Runtime.getRuntime().maxMemory();
long totalMemory = Runtime.getRuntime().totalMemory();
System.out.println("maxMemory=" + maxMemory + "(字节)" + (maxMemory / (double) (1024 * 1024)) + "MB");
System.out.println("totalMemory=" + totalMemory + "(字节)" + (totalMemory / (double) (1024 * 1024)) + "MB");
}
}
1.5 方法区
方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据,很多人更愿意把方法区称为永久代。那么方法区和永久代究竟有什么区别呢?《Java虚拟机规范》只是规定了有方法区这个概念和它的作用,并没有规定如何去实现它。那么,在不同的JVM上方法区的实现肯定是不同的了,同时大多数用的JVM是Sun公司的HotSpot,而HotSpot使用了永久代来实现方法区。因此,永久代是HotSpot的概念。但JDK1.8中HotSpot取消了永久代改为元空间,但这并不意味着方法区不存在了,因为方法区是规范,规范没变就会一直存在。
元空间和永久代有什么区别呢?永久代是堆得一部分而元空间属于本地内存;存储内容不同,元空间存储类的元信息,静态变量和常量池等并入堆中,相当于永久代的数据被分到了堆和元空间中。
Java堆除了不需要连续的内存和可以选择固定的大小和可扩展外,还可以选择不实现垃圾收集。相对而言,垃圾收集行为在这个区域是比较少出现的,该区域的内存回收目标主要是针对常量池的回收和对类型的卸载。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
1.6运行时常量池
运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息以外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
常量池可以理解为Class文件之中的资源仓库,它是Class文件结构中与其他项目资源关联最多的数据类型。常量池中主要存放两大类常量,字面量和符号引用。字面量包括文本字符串、声明为final的常量值等;符号引用包括类和接口的完全限定名、字段的名称和描述符、方法的名称和描述符。
既然运行时常量池是方法区的一部分,自然受到方法区域内存的限制,当常量池无法再申请到内存时便会抛出OutOfMemoryError异常。
1.7 直接内存
在JDK1.4中新加入了NIO类,引入了一种基于通道与缓冲区的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。显然,本机直接内存的方式不受Java堆大小的限制,但是,既然是内存,肯定受到本机总内存大小以及处理器寻址空间的限制。
2.HotSpot虚拟机对象
常见的JVM类型有HotSpot、JRockit和J9VM,而HotSpot应用最广泛,我们以HotSpot虚拟机为例,介绍一下对象的创建。
2.1 对象的创建
Java是一门面向对象的编程语言,在Java程序运行过程中每时每刻都有对象的创建。在语法层面中,创建对象(克隆、反序列化)通常仅仅需要一个new关键字,而虚拟机却需要进行大量的工作处理。Java虚拟机对象(不包括数组和Class对象等)的创建过程如下:
- 首先检查对象创建指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是都已经被加载、解析和初始化。如果没有,那必须先执行相应的类加载过程,类加载检查通过后,虚拟机将为新生对象分配内存。对象所需要的内存大小在类加载完成后便可以完全确定。
- 内存分配存在以下的两种方式:假设Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另外一边,中间放着一个指针作为分界点的指示物,那所分配的内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离,这种分配方式称之为“指针碰撞”。如果Java堆中的内存不是并不是规整的,已使用的内存和空闲的内存相互交错,此时虚拟机必须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”。
- 在并发情况下,可能出现正在给A分配内存,指针还没有来得及修改,对象B又同时使用原来的指针来分配内存,解决这个问题有两种情况:一种是对分配内存空间的动作进行同步处理;另外一种是每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定。
2.2 对象的内存布局
在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头、实例数据和对齐填充。
HotSpot虚拟机的对象头包括两部分信息,第一部分用于存储对象自身运行时数据,例如hashcode、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分数据在32位和64位的虚拟机中分别为32bit和64bit,官方称它为“Mark Word”。考虑到虚拟机的空间效率,Mark World被设计成一个非固定的数据结构以便在极小的空间内存储尽量多的信息,它会根据对象的状态复用自己的存储空间。对象头的另外一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针确定这个对象是哪个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针,也就是说查找对象的元数据信息并不一定要经过对象本身。
实例数据部分是对象真正存储的有效的信息,也就是程序代码中所定义的各种类型的字段内容,包括从父类中继承下来的。这部分的存储顺序会受到虚拟机分配策略和字段在Java源码中定义顺序的影响。HotSpot虚拟机默认的分配策略为占用相同字节宽度的字段总会被分配到一起。这个前提条件下,在父类中定义的变量总是会出现在子类之前。
对齐填充不是必然存在的,也没有特别的含义,它仅仅起到占位符的作用。由于HotSpot的自动内存管理系统要求对象起始地址必须为8字节的整数倍,也就是说对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数,因此当对象的实例数据部分没有对齐时,就需要通过对象填充来补全。
2.3 对象的访问定位
建立对象是为了使用对象,Java程序需要通过栈上的reference数据来操作堆上的具体对象。对象的访问方式有使用句柄和直接指针两种方式。如果使用句柄访问的话,那么Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。如下图所示:
如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,此时reference中存储的直接就是对象地址,如下图所示:
这两种对象访问方式各有优势,使用句柄访问最大的好处就是reference中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要修改。
使用直接指针访问方式的最大好处就是速度快,它节省了一次指针定位的时间开销。由于对象的访问在Java中是非常频繁的,因此这类开销积少成多后也是一项非常可观的执行成本。HotSpot主要使用第二种方式进行对象的访问。
3.JVM架构图