JVM浅出深入系列-第二章 JVM内存模型

原创已于 2022-07-13 11:21:54 修改 · 264 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#jvm #java #开发语言

于 2022-07-12 10:53:32 首次发布

JVM深入浅出专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了JVM的运行时数据区，包括方法区、堆、虚拟机栈、程序计数器和本地方法栈。方法区存储类信息、常量和静态变量，堆是对象实例和数组的存储区域。虚拟机栈保存线程的调用状态，每个方法对应一个栈帧。程序计数器记录线程执行位置。本地方法栈服务于Native方法。此外，还讨论了直接内存和CodeCache。文章还探讨了对象创建过程、内存分配、GC模式以及Survivor区的作用，防止内存碎片。

JVM浅出深入系列-第二章 JVM内存模型

运行时数据区(Run-Time Data Areas)

1、官网概括

官网：https://docs.oracle.com/javase/specs/jvms/se8/html/index.html

The Java Virtual Machine defines various run-time data areas that are used during execution of a program. Some of these data areas are created on Java Virtual Machine start-up and are destroyed only when the Java Virtual Machine exits. Other data areas are per thread. Per-thread data areas are created when a thread is created and destroyed when the thread exits.

2、图解

在这里插入图片描述

3、初步认识

3.1 Method Area(方法区)

（1）方法区是各个线程共享的内存区域，在虚拟机启动时创建
（2）虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分，但是它却又一个别名叫做Non-Heap(非堆)，目的是与Java堆区分开来
（3）用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据
（4）当方法区无法满足内存分配需求时，将抛出OutOfMemoryError异常

不同jdk版本的实现：
在JDK 8中就是Metaspace（元空间，使用的是直接内存），
在JDK6或7中就是Perm Space （永久代）

3.2 Heap(堆)

（1）Java堆是Java虚拟机所管理内存中最大的一块，在虚拟机启动时创建，被所有线程共享。
（2）Java对象实例以及数组都在堆上分配。

3.3 Java Virtual Machine Stacks(虚拟机栈)

（1）虚拟机栈是一个线程执行的区域，保存着一个线程中方法的调用状态。换句话说，一个Java线程
的运行状态，由一个虚拟机栈来保存，所以虚拟机栈肯定是线程私有的，独有的，随着线程的创建而创
建。

（2）每一个被线程执行的方法，为该栈中的栈帧，即每个方法对应一个栈帧。

调用一个方法，就会向栈中压入一个栈帧；一个方法调用完成，就会把该栈帧从栈中弹出。#### 3.4 The pc Register(程序计数器)

图解栈和栈帧

栈帧：
每个栈帧对应一个被调用的方法，可以理解为一个方法的运行空间。
每个栈帧中包括局部变量表(Local Variables)、操作数栈(Operand Stack)、指向运行时常量池的引用(Areference to the run-time constant pool)、方法返回地址(Return Address)和附加信息。
- 局部变量表:方法中定义的局部变量以及方法的参数存放在这张表中局部变量表中的变量不可直接使用，如需要使用的话，必须通过相关指令将其加载至操作数栈中作为操作数使用。
- 操作数栈:以压栈和出栈的方式存储操作数的
- 动态链接:每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用，持有这个引用是为了支持方法调用过程中的动态连接(Dynamic Linking)。
- 方法返回地址:当一个方法开始执行后,只有两种方式可以退出，一种是遇到方法返回的字节码指令；一种是遇见异常，并且这个异常没有在方法体内得到处理。

3.4 The pc Register(程序计数器)

我们都知道一个JVM进程中有多个线程在执行，而线程中的内容是否能够拥有执行权，是根据
CPU调度来的。
假如线程A正在执行到某个地方，突然失去了CPU的执行权，切换到线程B了，然后当线程A再获
得CPU执行权的时候，怎么能继续执行呢？这就是需要在线程中维护一个变量，记录线程执行到
的位置。

如果线程正在执行Java方法，则计数器记录的是正在执行的虚拟机字节码指令的地址；
如果正在执行的是Native方法，则这个计数器为空

3.5 Native Method Stacks(本地方法栈)

如果当前线程执行的方法是Native类型的，这些方法就会在本地方法栈中执行。

那如果在Java方法执行的时候调用native的方法呢？

在这里插入图片描述

3.6 其他

除了上面五块内存之外,其实我们的JVM还会使用到其他两块内存

直接内存（Direct Memory）
并不是虚拟机运行时数据区的一部分，也不是JVM规范中定义的内存区域，但是这部分内存也被频繁地使用，而且也可能导致OutOfMemoryError 异常出现，所以我们放到这里一起讲解。在JDK1.4 中新加了NIO类，引入了一种基于通道（Channel）与缓冲区（Buffer）的I/O 方式，它可以使用Native 函数库直接分配堆外内存，然后通过一个存储在Java 堆里面的DirectByteBuffer 对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能，因为避免了在Java 堆和Native 堆中来回复制数据。本机直接内存的分配不会受到Java 堆大小的限制，但是，既然是内存，则肯定还是会受到本机总内存的大小及处理器寻址空间的限制。因此在分配JVM空间的时候应该考虑直接内存所带来的影响，特别是应用到NIO的场景。
其他内存:
Code Cache：**JVM本身是个本地程序，还需要其他的内存去完成各种基本任务，比如，JIT编译器在运行时对热点方法进行编译，就会将编译后的方法储存在Code Cache里面；GC等功能。需要运行在本地线程之中，类似部分都需要占用内存空间。这些是实现JVM JIT等功能的需要，但规范中并不涉及

4、折腾一下

4.1 栈指向堆

如果在栈帧中有一个变量，类型为引用类型，比如Object obj=new Object()，这时候就是典型的栈中元素指向堆中的对象。

4.2 方法区指向堆

方法区中会存放静态变量，常量等数据。如果是下面这种情况，就是典型的方法区中元素指向堆中的对象。
```
private static Object obj=new Object();
```

在这里插入图片描述

4.3 堆指向方法区

What？堆还能指向方法区？
注意，方法区中会包含类的信息，堆中会有对象，那怎么知道对象是哪个类创建的呢？
在这里插入图片描述

4.4 Java对象内存模型

在这里插入图片描述

Class Pointer

在这里插入图片描述

JVM内存模型

1、与运行时数据区

上面对运行时数据区描述了很多，其实重点存储数据的是堆和方法区(非堆)，所以内存的设计也着重从这两方面展开(注意这两块区域都是线程共享的)。
对于虚拟机栈，本地方法栈，程序计数器都是线程私有的。
可以这样理解，JVM运行时数据区是一种规范，而JVM内存模式是对该规范的实现

2、图形展示

一块是非堆区，一块是堆区堆区分为两大块，
一个是Old区，一个是Young区 Young区分为两大块，
一个是Survivor区（S0+S1），一块是Eden区
S0和S1一样大，也可以叫From和To

在这里插入图片描述

3、对象创建过程

对象优先在Eden区分配
大对象直接进入老年代
长期存活的对象进入老年代
动态对象年龄判断
空间分配担保

一般情况下，新创建的对象都会被分配到Eden区，一些特殊的大的对象会直接分配到Old区。

我是一个普通的Java对象,我出生在Eden区,在Eden区我还看到和我长的很像的小兄弟,我们在Eden区中玩了挺长时间。有一天Eden区中的人实在是太多了,我就被迫去了Survivor区的“From”区,自从去了Survivor 区,我就开始漂了,有时候在Survivor的“From”区,有时候在Survivor的“To”区,居无定所。直到我18岁的时候,爸爸说我成人了,该去社会上闯闯了。于是我就去了年老代那边,年老代里,人很多,并且年龄都挺大的。

在这里插入图片描述

4、常见问题

如何理解各种GC

Partial GC Partial其实也就是部分的意思.那么翻译过来也就是回收部分GC堆的模式,他并不会回收我们整个堆.而我们的young GC以及我们的Old GC都属于这种模式
young GC 只回收young区
old GC 只回收Old区
full GC 实际上就是对于整体回收

为什么需要Survivor区?只有Eden不行吗？

如果没有Survivor,Eden区每进行一次Minor GC,存活的对象就会被送到老年代。这样一来，老年代很快被填满,触发Major GC(因为Major GC一般伴随着Minor GC,也可以看做触发了 Full GC)。
老年代的内存空间远大于新生代,进行一次Full GC消耗的时间比Minor GC长得多。执行时间长有什么坏处?频发的Full GC消耗的时间很长,会影响大型程序的执行和响应速度。
可能你会说，那就对老年代的空间进行增加或者较少咯。
假如增加老年代空间，更多存活对象才能填满老年代。虽然降低Full GC频率，但是随着老年代空间加大,一旦发生Full GC,执行所需要的时间更长。
假如减少老年代空间，虽然Full GC所需时间减少，但是老年代很快被存活对象填满,Full GC频率增加。
所以Survivor的存在意义,就是减少被送到老年代的对象,进而减少Full GC的发生,Survivor的预筛选保证,只有经历16次Minor GC还能在新生代中存活的对象,才会被送到老年代。

为什么需要两个Survivor区？

最大的好处就是解决了碎片化。
也就是说为什么一个Survivor区不行?第一部分中,我们知道了必须设置 Survivor区。假设现在只有一个Survivor区,我们来模拟一下流程: 刚刚新建的对象在Eden中,一旦Eden满了,触发一次Minor GC,Eden中的存活对象就会被移动到Survivor 区。这样继续循环下去,下一次Eden满了的时候,问题来了,此时进行Minor GC,Eden和Survivor各有一些存活对象,如果此时把Eden区的存活对象硬放到Survivor区,很明显这两部分对象所占有的内存是不连续的, 也就导致了内存碎片化。
永远有一个Survivor space是空的,另一个非空的Survivor space无碎片。