JVM内存结构解析-优快云博客

本文详细介绍了JVM的启动流程、基本结构及内存分配，包括程序计数器、方法区、堆内存、栈内存和本地方法栈的功能与作用。同时探讨了内存模型、可见性、有序性和指令重排，以及解释运行和编译运行的概念。

一、JVM启动流程：

JVM启动时，是由java命令/javaw命令来启动的。

二、JVM基本结构：

JVM基本结构图：

《深入理解Java虚拟机（第二版）》中的描述是下面这个样子的：

Java中的内存分配：

Java程序在运行时，需要在内存中的分配空间。为了提高运算效率，就对数据进行了不同空间的划分，因为每一片区域都有特定的处理数据方式和内存管理方式。

具体划分为如下5个内存空间：（非常重要）

栈：存放局部变量
堆：存放所有new出来的东西
方法区：被虚拟机加载的类信息、常量、静态常量等。
程序计数器(和系统相关)
本地方法栈

1、PC寄存器/程序计数器:

每个线程拥有一个PC寄存器

在线程创建时创建

指向下一条指令的地址

执行本地方法时，PC的值为undefined

严格来说是一个数据结构，用于保存当前正在执行的程序的内存地址，由于Java是支持多线程执行的，所以程序执行的轨迹不可能一直都是线性执行。当有多个线程交叉执行时，被中断的线程的程序当前执行到哪条内存地址必然要保存下来，以便用于被中断的线程恢复执行时再按照被中断时的指令地址继续执行下去。为了线程切换后能恢复到正确的执行位置，每个线程都需要有一个独立的程序计数器，各个线程之间计数器互不影响，独立存储，我们称这类内存区域为“线程私有”的内存,这在某种程度上有点类似于“ThreadLocal”，是线程安全的。

2、方法区:

保存装载的类信息

　　类型的常量池

　　字段，方法信息

　　方法字节码

通常和永久区(Perm)关联在一起

方法区存放了要加载的类的信息（名称、修饰符等）、类中的静态常量、类中定义为final类型的常量、类中的Field信息、类中的方法信息，当在程序中通过Class对象的getName.isInterface等方法来获取信息时，这些数据都来源于方法区。方法区是被Java线程锁共享的，不像Java堆中其他部分一样会频繁被GC回收，它存储的信息相对比较稳定，在一定条件下会被GC，当方法区要使用的内存超过其允许的大小时，会抛出OutOfMemory的错误信息。方法区也是堆中的一部分，就是我们通常所说的Java堆中的永久区 Permanet Generation，大小可以通过参数来设置,可以通过-XX:PermSize指定初始值，-XX:MaxPermSize指定最大值。

3、堆内存:

和程序开发密切相关

应用系统对象都保存在Java堆中

所有线程共享Java堆

对分代GC来说，堆也是分代的

GC管理的主要区域

堆是JVM所管理的内存中国最大的一块，是被所有Java线程锁共享的，不是线程安全的，在JVM启动时创建。堆是存储Java对象的地方，这一点Java虚拟机规范中描述是：所有的对象实例以及数组都要在堆上分配。Java堆是GC管理的主要区域，从内存回收的角度来看，由于现在GC基本都采用分代收集算法，所以Java堆还可以细分为：新生代和老年代；新生代再细致一点有Eden空间、From Survivor空间、To Survivor空间等

成员变量存储在堆中的对象里面，由垃圾回收器负责回收

4、栈内存：

线程私有，生命周期和线程相同
栈由一系列帧组成（因此Java栈也叫做帧栈）
帧保存一个方法的局部变量、操作数栈、常量池指针
每一次方法调用创建一个帧，并压栈

解释：

Java栈总是与线程关联在一起的，每当创建一个线程，JVM就会为该线程创建对应的Java栈，在这个Java栈中又会包含多个栈帧(Stack Frame)，这些栈帧是与每个方法关联起来的，每运行一个方法就创建一个栈帧，每个栈帧会含有一些局部变量、操作栈和方法返回值等信息。每当一个方法执行完成时，该栈帧就会弹出栈帧的元素作为这个方法的返回值，并且清除这个栈帧，Java栈的栈顶的栈帧就是当前正在执行的活动栈，也就是当前正在执行的方法，PC寄存器也会指向该地址。只有这个活动的栈帧的本地变量可以被操作栈使用，当在这个栈帧中调用另外一个方法时，与之对应的一个新的栈帧被创建，这个新创建的栈帧被放到Java栈的栈顶，变为当前的活动栈。同样现在只有这个栈的本地变量才能被使用，当这个栈帧中所有指令都完成时，这个栈帧被移除Java栈，刚才的那个栈帧变为活动栈帧，前面栈帧的返回值变为这个栈帧的操作栈的一个操作数。

局部变量的数据存在于栈内存中。栈内存中的局部变量随着方法的消失而消失。

在Java虚拟机规范中，对这个区域规定了两种异常情况：

（1）如果线程请求的栈深度太深，超出了虚拟机所允许的深度，就会出现StackOverFlowError（比如无限递归。因为每一层栈帧都占用一定空间，而 Xss 规定了栈的最大空间，超出这个值就会报错）

（2）虚拟机栈可以动态扩展，如果扩展到无法申请足够的内存空间，会出现OOM

4.1 Java栈之局部变量表：包含参数和局部变量

局部变量表存放了基本数据类型、对象引用和returnAddress类型（指向一条字节码指令的地址）。其中64位长度的long和double类型的数据会占用2个局部变量空间（slot），其余数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配。

例如，我写出下面这段代码：

package test03;

/**
 * Created by smyhvae on 2015/8/15.
 */
public class StackDemo {
    
    //静态方法
    public static int runStatic(int i, long l, float f, Object o, byte b) {
        return 0;
    }

    //实例方法
    public int runInstance(char c, short s, boolean b) {
        return 0;
    }

}

上方代码中，静态方法有6个形参，实例方法有3个形参。其对应的局部变量表如下：

上方表格中，静态方法和实例方法对应的局部变量表基本类似。但有以下区别：实例方法的表中，第一个位置存放的是当前对象的引用。

4、2 Java栈之函数调用组成栈帧：

方法每次被调用的时候都会创建一个栈帧，例如下面这个方法：

public static int runStatic(int i,long l,float  f,Object o ,byte b){
       return runStatic(i,l,f,o,b);
}

当它每次被调用的时候，都会创建一个帧，方法调用结束后，帧出栈。如下图所示：

4.3 Java栈之操作数栈

Java没有寄存器，所有参数传递都是使用操作数栈

例如下面这段代码：

    public static int add(int a,int b){
        int c=0;
        c=a+b;
        return c;
    }

压栈的步骤如下：

　　0: iconst_0 // 0压栈

　　1: istore_2 // 弹出int，存放于局部变量2

　　2: iload_0 // 把局部变量0压栈

　　3: iload_1 // 局部变量1压栈

　　4: iadd //弹出2个变量，求和，结果压栈

　　5: istore_2 //弹出结果，放于局部变量2

　　6: iload_2 //局部变量2压栈

　　7: ireturn //返回

如果计算100+98的值，那么操作数栈的变化如下图所示：

4.4 Java栈之栈上分配：

小对象（一般几十个bytes），在没有逃逸的情况下，可以直接分配在栈上

直接分配在栈上，可以自动回收，减轻GC压力

大对象或者逃逸对象无法栈上分配

栈、堆、方法区交互：

5.常量池Constant Pool:

　　常量池本身是方法区中的一个数据结构。常量池中存储了如字符串、final变量值、类名和方法名常量。常量池在编译期间就被确定，并保存在已编译的.class文件中。一般分为两类：字面量和应用量。字面量就是字符串、final变量等。类名和方法名属于引用量。引用量最常见的是在调用方法的时候，根据方法名找到方法的引用，并以此定为到函数体进行函数代码的执行。引用量包含：类和接口的权限定名、字段的名称和描述符，方法的名称和描述符。

6.本地方法栈Native Method Stack:

　　本地方法栈和Java栈所发挥的作用非常相似，区别不过是Java栈为JVM执行Java方法服务，而本地方法栈为JVM执行Native方法服务。本地方法栈也会抛出StackOverflowError和OutOfMemoryError异常。

三、内存模型：

每一个线程有一个工作内存。工作内存和主存独立。工作内存存放主存中变量的值的拷贝。

当数据从主内存复制到工作存储时，必须出现两个动作：第一，由主内存执行的读（read）操作；第二，由工作内存执行的相应的load操作；当数据从工作内存拷贝到主内存时，也出现两个操作：第一个，由工作内存执行的存储（store）操作；第二，由主内存执行的相应的写（write）操作。

每一个操作都是原子的，即执行期间不会被中断

对于普通变量，一个线程中更新的值，不能马上反应在其他变量中。如果需要在其他线程中立即可见，需要使用volatile关键字作为标识。

1、可见性：

　　一个线程修改了变量，其他线程可以立即知道

保证可见性的方法：

volatile

synchronized （unlock之前，写变量值回主存）

final(一旦初始化完成，其他线程就可见)

2、有序性：

　　在本线程内，操作都是有序的

　　在线程外观察，操作都是无序的。（指令重排或主内存同步延时）

3、指令重排：

指令重排：破坏了线程间的有序性：

指令重排：保证有序性的方法：

指令重排的基本原则：

程序顺序原则：一个线程内保证语义的串行性

volatile规则：volatile变量的写，先发生于读

锁规则：解锁(unlock)必然发生在随后的加锁(lock)前

传递性：A先于B，B先于C 那么A必然先于C

线程的start方法先于它的每一个动作

线程的所有操作先于线程的终结（Thread.join()）

线程的中断（interrupt()）先于被中断线程的代码

对象的构造函数执行结束先于finalize()方法

四、解释运行和编译运行的概念：

解释运行：