JVM学习之路（4）Java内存区域_arthas的memory direct-优快云博客

目录

引入：

程序计数器

栈

Java虚拟机栈

栈帧的组成

局部变量表

操作数栈

帧数据

栈内存溢出

本地方法栈

堆

方法区

静态变量存在哪里

直接方法区

总结

运行时数据区分成哪几部分，每一部分的作用是什么?

不同JDK版本之间运行时数据区域的区别是什么?

欢迎关注我的博客！26届java选手，一起加油💘💦👨‍🎓😄😂

引入：

从JVM 的组成看Java内存区域：

Java虚拟机在运行Java程序过程中管理的内存区域，称之为运行时数据区。
《Java虚拟机规范》中规定了每一部分的作用。

两个概念：

线程不共享：就是其他线程访问不了我当前线程的数据：不共享但安全性高

线程共享：放入数据，每个线程都会被获取使用，会出现线程安全问题。

接下来挨个介绍

程序计数器

程序计数器 (Program Counter Register) 也叫PC寄存器，每个线程会通过程序计数器记录当前要执行的的字节码指令的地址。

一个程序计数器的具体案例

类加载阶段

在加载阶段，虚拟机将字节码文件中的指令读取到内存之后，会将原文件中的偏移量转换成内存地址。每一条字节码指令都会拥有一个内存地址。

真实的虚拟机中是每一行字节码指令的地址，在此处用偏移量代替方便展示。

在代码执行过程中，程序计数器会记录下一行字节码指令的地址。执行完当前指令之后，虚拟机的执行引擎根据程序计数器执行下一行指令。

一路往下执行，我们发现，程序计数器里面保存的永远是我们接下来要执行的字节码指令的地址，那么解释器就可以根据这个地址正确的找到我们要执行的下一行指令，通过程序计数器，咱们就可以去实现一些复杂的逻辑：

程序计数器可以控制程序指令的进行，实现分支、跳转、异常等逻辑。

第二个作用：在多线程执行情况下，Java虚拟机需要通过程序计数器记录CPU切换前解释执行到那一句指令并继续解释运行。

问题：程序计数器在运行中会出现内存溢出吗？

内存溢出指的是程序在使用某一块内存区域时，存放的数据需要占用的内存大小超过了虚拟机能提供的内存上限。
因为每个线程只存储一个固定长度的内存地址，程序计数器是不会发生内存溢出的。
程序员无需对程序计数器做任何处理

栈

Java虚拟机栈

保存在java中实现的方法，每次执行这些方法就会把信息往栈里保存。

Java虚拟机栈(Java Virtual Machine Stack)采用栈的数据结构来管理方法调用中的基本数据，先进后出 (Firstin Last 0ut),每一个方法的调用使用一个栈帧(Stack Frame) 来保存。

开始执行的时候main方法入栈了：

执行到study方法，study方法也入栈了：

执行study方法中的eat方法，也将其入栈，并且打印数据

eat方法执行完了，就要出栈了，然后轮到sleep方法执行，将其入栈，输出语句

study方法也结束了，弹出

最后main也出栈了，为空了

Java虚拟机栈随着线程的创建而创建，而回收则会在线程的销毁时进行。由于方法可能会在不同线程中执行，每个线程都会包含一个自己的虚拟机栈。

栈帧的组成

局部变量表：局部变量表的作用是在运行过程中存放所有的局部变量
操作数栈：操作数栈是栈帧中虚拟机在执行指令过程中用来存放临时数据的一块区域
帧数据：帧数据主要包含动态链接、方法出口、异常表的引用

局部变量表

局部变量表的作用是在方法执行过程中存放所有的局部变量。编译成字节码文件时就可以确定局部变量表的内容。

查看局部变量表：

详解这一张局部变量表，nr为编号，起始pc表示从第几个字节码开始可以被访问到，这里

栈帧中的局部变量表长啥样呢？

栈帧中的局部变量表是一个数组，数组中每一个位置称之为槽(slot)，long和double类型占用两个槽，其他类型占用一个槽。

int 占一个 long 占两个

实例方法中的序号为0的位置存放的是this，指的是当前调用方法的对象，运行时会在内存中存放实例对象的地址。

方法参数也会保存在局部变量表中，其顺序与方法中参数定义的顺序一致
局部变量表保存的内容有:实例方法的this对象，方法的参数，方法体中声明的局部变量。

问题：以下代码的局部变量表会占用几个槽？

根据以上的理论，我们会认为以下局部变量占了9个槽，但实际上不是的：是六个

为了节省空间，局部变量表中的槽是可以复用的，一旦某个局部变量不再生效，当前槽就可以再次被使用。

执行到这里的时候a和b都放入槽中了：

这里把c放到3号槽，因为上一个代码块已经执行完了，

又一个代码块执行完了，轮到最后两个变量了，他们一起占有三个槽，所以最后也只占了六个槽。

操作数栈

操作数栈是栈帧中虚拟机在执行指令过程中用来存放中间数据的一块区域。他是一种栈式的数据结构，如果一条指令将一个值压入操作数栈，则后面的指令可以弹出并使用该值。
在编译期就可以确定操作数栈的最大深度，从而在执行时正确的分配内存大小。

作数栈最大深度的计算方法（案例）：

首先0会被放入操作数栈

然后存入到局部变量表

把1号位置取到操作数栈中

这个时候操作数栈有两个了，

执行相加操作：

然后取出上一步相加的结果--1 再return，就结束了。

因此刚刚的程序中最多有两个数据。操作数栈的最大深度是2。

帧数据

动态链接：当前类的字节码指令引用了其他类的属性或者方法时，需要将符号引用(编号)转换成对应的运行时常量池中的内存地址。动态链接就保存了编号到运行时常量池的内存地址的映射关系 。

方法出口：指的是方法在正确或者异常结束时，当前栈帧会被弹出，同时程序计数器应该指向上一个栈帧中的下一条指令的地址。所以在当前栈帧中，需要存储此方法出口的地址。

异常表：存放的是代码中异常的处理信息，包含了异常捕获的生效范围以及异常发生后跳转到的字节码指令位置

如果捕获到异常，跳转到第七条，并为其赋值为2，结束程序。

通过异常表，java虚拟机可以在一个范围的字节码指令中，去捕获对应的异常，如果捕获到异常之后，也可以通过异常表来知道到底应该跳转到哪一行字节码指令继续往下运行，所以异常表在异常处理的过程中非常有用。

栈内存溢出

Java虚拟机栈如果栈帧过多，占用内存超过栈内存可以分配的最大大小就会出现内存溢出。
Java虚拟机栈内存溢出时会出现StackOverflowError的错误

默认大小：如果我们不指定栈的大小，JVM 将创建一个具有默认大小的栈。大小取决于操作系统和计算机的体系结构。

模拟：占内存溢出

使用递归让方法调用自身，但是不设置退出条件定义调用次数的变量，每一次调用让变量加1。查看错误发生时总调用的次数。

栈帧在一直累加：

直接放行：看到栈帧到10684之后就内存溢出了。

自己设置栈的大小：

要修改Java虚拟机栈的大小，可以使用虚拟机参数-Xss。
语法:-Xss栈大小
单位:字节(默认，必须是1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)

设置为1024k

调整成512k

数量就更小了。

注意事项。

1、与-Xss类似，也可以使用 -XX:ThreadstackSize 调整标志来配置堆栈大小。格式为:-XX:ThreadstackSize=1024
2、HotSpotJVM对栈大小的最大值和最小值有要求:比如测试如下两个参数:
-Xss1k 或者 -Xss1025m ！！windows(64位)下的JDK8测试最小值为180k，最大值为1024m。
3、局部变量过多、操作数栈深度过大也会影响栈内存的大小。

声明多个局部变量：总的栈帧值就下降了。

一般情况下，工作中即便使用了递归进行操作，栈的深度最多也只能到几百,不会出现栈的溢出。所以此参数可以手动指定为-Xss256k节省内存

本地方法栈

保存加了native 本地关键字用c++实现的方法：

Java虚拟机栈存储了Java方法调用时的栈帧，而本地方法栈存储的是native本地方法的栈帧。
在Hotspot虚拟机中，Java虚拟机栈和本地方法栈实现上使用了同一个栈空间。本地方法栈会在栈内存上生成一个栈帧，临时保存方法的参数同时方便出现异常时也把本地方法的栈信息打印出来

堆

一般Java程序中堆内存是空间最大的一块内存区域。创建出来的对象都存在于堆上。
栈上的局部变量表中，可以存放堆上对象的引用。静态变量也可以存放堆对象的引用，通过静态变量就可以实现对象在线程之间共享。

堆内存是否会溢出？

堆内存确实是会溢出的，每次加1kb的数据就不会溢出，但是当100m的数据的时候就会溢出。

堆空间有三个需要关注的值，used total max。
used指的是当前已使用的堆内存，total是java虚拟机已经分配的可用堆内存，max是java虚拟机可以分配的最大堆内存。

arthas中堆内存相关的功能

堆内存used total max三个值可以通过dashboard命令看到。
手动指定刷新频率(不指定默认5秒一次):dashboard -i 刷新频率(毫秒)

如下图的堆内存最大值是七个G，这是虚拟机默认设置的。

total不够用的时候会给total继续分配：随着堆中的对象增多，当total可以使用的内存即将不足时，java虚拟机会继续分配内存给堆。

在两次查询内存的中间我们加入三百M的数据，可以看到total已经不够用了，然后就进行了扩容。

直到total = max

问题：是不是当used = max = total 的时候，堆内存就溢出了呢？

不是，堆内存溢出的判断条件比较复杂，后续讲。

怎么在虚拟机中配置max 和 total ？

如果不设置任何的虚拟机参数，max默认是系统内存的1/4，total默认是系统内存的1/64。在实际应用中一般都需要设置total和max的值。
Oracle官方文档: https://docs.oracle.com/iavase/8/docs/technotes/tools/unix/iava.htm

设置大小

要修改堆的大小，可以使用虚拟机参数 -Xmx (max最大值)和 -Xms(初始的total)
语法:-Xmx值 -Xms值
单位:字节(默认，必须是1024 的倍数)、k或者K(KB)、m或者M(MB)、g或者G(GB)
限制:Xmx必须大于 2MB，Xms必须大于1MB

打开arthas 查看内存分配是否成功了

为什么不是4096？而是3925？

问题：为什么arthas中显示的heap堆大小与设置的值不一样呢?

arthas中的heap堆内存使用了JMX技术中内存获取方式，这种方式与垃圾回收器有关，计算的是可以分配对象的内存，而不是整个内存。

设置为 1g 的时候，查看 total 和 max 也不是1g

Java服务端程序开发时，建议将-Xmx和-Xms设置为相同的值，这样在程序启动之后可使用的总内存就是最大内存，而无需向java虚拟机再次申请，减少了申请并分配内存时间上的开销，同时也不会出现内存过剩之后堆收缩的情况。

方法区

方法区是存放基础信息的位置，线程共享，主要包含三部分内容：

类的元信息：保存了所有类的基本信息
运行时常量池：保存了字节码文件中的常量池内容
字符串常量池：保存了字符串常量

方法区是用来存储每个类的基本信息 (元信息)，一般称之为InstanceKlass对象。在类的加载阶段完成。

方法区除了存储类的元信息之外，还存放了运行时常量池。常量池中存放的是字节码中的常量池内容。
字节码文件中通过编号查表的方式找到常量，这种常量池称为静态常量池。当常量池加载到内存中之后，可以通过内存地址快速的定位到常量池中的内容，这种常量池称为运行时常量池。

方法区是《Java虚拟机规范》中设计的虚拟概念，每款Java虚拟机在实现上都各不相同。Hotspot设计如下：

JDK7及之前的版本将方法区存放在堆区域中的永久代空间，堆的大小由虚拟机参数来控制。
JDK8及之后的版本将方法区存放在元空间中，元空间位于操作系统维护的直接内存中，默认情况下只要不超过操作系统承受的上限，可以一直分配。

arthas中查看方法区

使用memory打印出内存情况，JDK7及之前的版本查看psperm gen属性
JDK8及之后的版本查看metaspace属性。

JDK7 ：永久代溢出

实验发现，JDK7上运行大概十几万次，就出现了错误。在JDK8上运行百万次，程序都没有出现任何错误，但是内存会直线升高。这说明JDK7和JDK8在方法区的存放上，采用了不同的设计。

JDK7将方法区存放在堆区域中的永代空间，堆的大小由虚拟机参数 -XX:MaxPermsize=值来控制。
JDK8将方法区存放在元空间中，元空间位于操作系统维护的直接内存中，默认情况下只要不超过操作系统承受的上限，可以一直分配。可以使用 -XX:MaxMetaspacesize=值将元空间最大大小进行限制。

报错：

字符串常量池

方法区中除了类的元信息、运行时常量池之外，还有一块区域叫字符串常量池(StringTable)。
字符串常量池存储在代码中定义的常量字符串内容。比如“123” 这个123就会被放入字符串常量池。

字符串常量池和运行时常量池有什么关系?
早期设计时，字符串常量池是属于运行时常量池的一部分，他们存储的位置也是一致的。后续做出了调整将字符串常量池和运行时常量池做了拆分。

一个小的题目：输出 true 还是 false ？

结果：c指向字符串常量池， d指向的是堆内存。因为a+b底层是StringBuilder实现，然后new string（），到了堆内存中。所以结果是false

但是，如果是以下情况就是true了

最大的区别， + 号左右是变量还是常量

String.intern()方法是可以手动将字符串放入字符串常量池中，分别在JDK6 和 JDK8下执行代码，JDK6 中结果是false false，JDK8中是true false

JDK6版本中intern()方法会把第一次遇到的字符串实例复制到永久代的字符串常量池中，返回的也是永久代里面这个字符串实例的引用。JVM启动时就会把java加入到常量池中。

JDK7及之后版本中由于字符串常量池在堆上，所以intern()方法会把第一次遇到的字符串的引用放入字符串常量池。

静态变量存在哪里

运行时数据区都学完了，静态变量存储在哪里呢?

JDK6及之前的版本中，静态变量是存放在方法区中的，也就是永久代

JDK7及之后的版本中，静态变量是存放在堆中的Class对象中，脱离了永久代具体源码可参考虚拟机源码: Bytecodelnterpreter针对putstatic指令的处理

直接方法区

直接内存(Direct Memory)并不在《Java虚拟机规范》中存在，所以并不属于Java运行时的内存区域。在JDK 1.4中引入了NIO机制，使用了直接内存，主要为了解决以下两个问题:
1、Java堆中的对象如果不再使用要回收，回收时会影响对象的创建和使用。
2、IO操作比如读文件，需要先把文件读入直接内存(缓冲区)再把数据复制到Java堆中现在直接放入直接内存即可，同时Java堆上维护直接内存的引用，减少了数据复制的开销。写文件也是类似的思路。