【JVM】5、虚拟机栈

最新推荐文章于 2024-08-13 09:18:43 发布

zxfhahaha

最新推荐文章于 2024-08-13 09:18:43 发布

阅读量233

点赞数

CC 4.0 BY-SA版权

分类专栏： JVM

本文链接：https://blog.youkuaiyun.com/zxfhahaha/article/details/112732588

JVM 专栏收录该内容

19 篇文章

订阅专栏

参考

虚拟机栈概述

虚拟机栈出现背景
由于java的虚拟机是基于栈的指令集架构，所以就有了虚拟机栈。
- 由于跨平台性的设计，Java的指令都是根据栈来设计的。不同平台CPU架构不同，所以不能设计为基于寄存器的。
- 优点是跨平台，指令集小，编译器容易实现，缺点是性能下降，实现同样的功能需要更多的指令。
内存中的栈与堆
栈是运行时的单位，而堆是存储的单位
- 栈解决程序的运行问题，即程序如何执行，或者说如何处理数据。
- 堆解决的是数据存储的问题，即数据怎么放，放哪里

虚拟机栈的基本内容

Java虚拟机栈是什么
Java虚拟机栈（Java Virtual Machine Stack），早期也叫Java栈。每个线程在创建时都会创建一个虚拟机栈，所以栈是线程私有的。
Java虚拟机栈内部保存一个个的栈帧（Stack Frame），一个栈帧对应一个java方法。
Java虚拟机栈生命周期
生命周期与线程一致，也就是线程结束了，该虚拟机栈也销毁了
Java虚拟机栈作用
主管Java程序的运行，它保存方法的局部变量（8 种基本数据类型、对象的引用地址）、部分结果，并参与方法的调用和返回。

虚拟机栈的主要特点

栈是一种快速有效的分配存储方式，访问速度仅次于程序计数器。
JVM直接对Java栈的操作只有两个：
- 每个方法执行，伴随着进栈（入栈、压栈）
- 执行结束后的出栈工作
对于栈来说不存在垃圾回收问题即GC，但栈存在溢出的情况即OOM

虚拟机栈的异常

Java 虚拟机规范允许Java栈的大小是动态的或者是固定不变的。

采用固定大小的JAVA虚拟机栈，会出现StackoverflowError 异常
如果采用固定大小的Java虚拟机栈，那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量，Java虚拟机将会抛出一个StackoverflowError 异常。
示例：
一直自己调自己

出现StackoverflowError 异常
Java虚拟机栈可以动态扩展，会出现OutofMemoryError 异常
如果Java虚拟机栈可以动态扩展，并且在尝试扩展的时候无法申请到足够的内存，或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈，那Java虚拟机将会抛出一个 OutofMemoryError 异常。
注意：HotSpot虚拟机的栈容量是不可以动态扩展的，所以不会由于无法扩展OOM，但是如果申请时就失败，仍然会出现OOM的。

设置栈内存大小

我们可以使用参数 -Xss 选项来设置线程的最大栈空间，栈的大小直接决定了函数调用的最大可达深度。

官方文档介绍：
在这里插入图片描述

-Xss1024m		// 栈内存为 1024MBS
-Xss1024k		// 栈内存为 1024KB

在IDEA中运行时进行设置：
在这里插入图片描述

栈的存储单位

每个线程都有自己的栈，栈中的数据都是以栈帧（Stack Frame）的格式存在
线程>–<栈
在这个线程上正在执行的每个方法都各自对应一个栈帧（Stack Frame）。
方法>–<栈帧
栈帧是一个内存区块，是一个数据集，维系着方法执行过程中的各种数据信息。

栈的运行原理

在这里插入图片描述

JVM直接对Java栈的操作只有两个，就是对栈帧的压栈和出栈，遵循先进后出（后进先出）原则
在一条活动线程中，一个时间点上，只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧（栈顶栈帧）是有效的
- 这个栈帧被称为当前栈帧（Current Frame）
- 与当前栈帧相对应的方法就是当前方法（Current Method）
- 定义这个方法的类就是当前类（Current Class）
执行引擎运行的所有字节码指令只针对当前栈帧进行操作。
如果在该方法中调用了其他方法，对应的新的栈帧会被创建出来，放在栈的顶端，成为新的当前帧。
不同线程中所包含的栈帧是不允许存在相互引用的，即不可能在一个栈帧之中引用另外一个线程的栈帧。
Java方法有两种返回函数的方式，但不管使用哪种方式，都会导致栈帧被弹出
- 正常的函数返回，使用return指令
  如果对异常进行trycatch了那也是这种正常函数返回的情况
- 以抛出异常的方式结束
  方法执行中未出现未捕获处理的异常，就会以抛出异常的方式结束

栈帧的内部结构

在这里插入图片描述
每个栈帧中存储着：

局部变量表（Local Variables）
操作数栈（Operand Stack）（或表达式栈）
动态链接（Dynamic Linking）（或指向运行时常量池的方法引用）
方法返回地址（Return Address）（或方法正常退出或者异常退出的定义）
一些附加信息

有些地方将动态链接、方法返回地址、一些附加信息统称为帧数据区
并行每个线程下的栈都是私有的，因此每个线程都有自己各自的栈，并且每个栈里面都有很多栈帧，栈帧的大小主要由局部变量表和操作数栈决定的
在这里插入图片描述

局部变量表

在栈帧中，与性能调优关系最为密切的部分就是局部变量表。在方法执行时，虚拟机使用局部变量表完成方法的传递。
局部变量表中的变量也是重要的垃圾回收根节点，只要被局部变量表中直接或间接引用的对象都不会被回收。

局部变量表概念

局部变量表：Local Variables，被称之为局部变量数组或本地变量表

局部变量表定义为一个数字数组，主要用于存储方法参数和定义在方法体内的局部变量，这些数据类型包括各类基本数据类型、对象引用（reference），以及returnAddress类型。
由于局部变量表是建立在线程的栈上，是线程的私有数据，因此不存在数据安全问题
局部变量表所需的容量大小是在编译期确定下来的，并保存在方法的Code属性的maximum local variables数据项中。在方法运行期间是不会改变局部变量表的大小的。
方法嵌套调用的次数由栈的大小决定。一般来说，栈越大，方法嵌套调用次数越多。
- 对一个函数而言，它的参数和局部变量越多，使得局部变量表膨胀，它的栈帧就越大，以满足方法调用所需传递的信息增大的需求。
- 进而函数调用就会占用更多的栈空间，导致其嵌套调用次数就会减少。
局部变量表中的变量只在当前方法调用中有效。
- 在方法执行时，虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。
- 当方法调用结束后，随着方法栈帧的销毁，局部变量表也会随之销毁。

字节码中方法内部结构的剖析

Methods下的main
- 方法形参类型 [Ljava/lang/String] ：
  - [] 表示数组
  - L 表示引用类型
  - java/lang/String 表示 java.lang.String
main下的Code
- ByteCode 字节码指令
  push 就是把数放到操作数栈上
  store_index就是保存在局部变量index位置
  load_index是从局部变量取index位置上的值
- Exception table 方法异常表
- Misc 杂项
  有局部变量个数、字节码长度
LineNumberTable行号表：
java代码行号和字节码指令行号的对应关系
LocalVariableTable 局部变量表
- Start PC：字节码指令的行号，表示当前变量作用域起始的位置，即声明的下一行
- length：和Start PC一起表示当前局部变量作用域的范围
- description：是变量类型

局部变量表的基本存储单元：Slot

参数值的存放总是从局部变量数组索引 0 的位置开始，到数组长度-1的索引结束。
局部变量表，最基本的存储单元是Slot（变量槽），局部变量表中存放编译期可知的各种基本数据类型（8种），引用类型（reference），returnAddress类型的变量。
在局部变量表里，32位以内的类型只占用一个slot（包括returnAddress类型、引用类型），64位的类型占用两个slot（1ong和double）。
JVM会为局部变量表中的每一个Slot都分配一个访问索引，通过这个索引即可成功访问到局部变量表中指定的局部变量值
占两个slot的会调它的起始索引
当一个实例方法被调用的时候，它的方法参数和方法体内部定义的局部变量将会按照顺序被复制到局部变量表中的每一个slot上
如果当前帧是由构造方法或者实例方法创建的，那么该对象引用this将会存放在index为0的slot处，其余的参数按照参数表顺序继续排列。
- 实例方法
- 构造器
- 静态方法（无this）
  从这里也可以得知静态方法里不能调this，因为this不存在与静态方法的局部变量表中。

Slot的重复利用

栈帧中的局部变量表中的槽位是可以重用的，如果一个局部变量过了其作用域，那么在其作用域之后申明新的局部变量变就很有可能会复用过期局部变量的槽位，从而达到节省资源的目的。
在这里插入图片描述

静态变量和局部变量的对比

变量的分类：
- 按照数据类型分：
  - 基本数据类型
  - 引用数据类型
- 按照在类中声明的方式分：
  - 成员变量
    成员变量在使用前都经历过系统的默认初始化赋值
    - 类变量（静态变量）
      在linking的prepare阶段给类变量默认赋值为0；在initial阶段给类变量显式赋值
    - 实例变量
      随着对象的创建，会在堆空间中分配实例变量空间，并进行默认赋值
  - 局部变量
    和类变量不同，局部变量表不存在系统初始化的过程
    因此局部变量在使用前，必须要进行人为显式赋值的否则，编译不通过

操作数栈

操作数栈：Operand Stack

操作数栈，在方法执行过程中，根据字节码指令，往栈中写入数据或提取数据，即入栈（push）和出栈（pop）
虽然操作数栈是用数组实现的，但是操作数栈并非采用访问索引的方式来进行数据访问的，而是只能通过标准的入栈和出栈操作来完成一次数据访问
操作数栈，主要用于保存计算过程的中间结果，同时作为计算过程中变量临时的存储空间。
操作数栈就是JVM执行引擎的一个工作区，当一个方法刚开始执行的时候，一个新的栈帧也会随之被创建出来，这时方法的操作数栈是空的
- 创建出来长度就已经确定好了，只是里面没有内容
- 每一个操作数栈都会拥有一个明确的栈深度用于存储数值，其所需的最大深度在编译期就定义好了，保存在方法的Code属性中，为maxstack的值。
栈中的任何一个元素都是可以任意的Java数据类型
- 32bit的类型占用一个栈单位深度
- 64bit的类型占用两个栈单位深度
如果被调用的方法带有返回值的话，其返回值将会被压入当前栈帧的操作数栈中（被调用的方法的ireturn中压入的调用它的方法的栈帧），并更新PC寄存器中下一条需要执行的字节码指令。
比如下面我们用testGetSum()方法调getSum()
- getSum()的ireturn 将结果压到调它的方法的栈帧的操作数栈中
  
  ireturn方法描述如下：
- testGetSum()
  
  invoke那一句去调getSum，然后getSum的ireturn把返回值放到testSum的操作数栈。
  然后istore再把操作数栈的值放到局部变量表中
Java虚拟机的解释引擎是基于栈的执行引擎，其中的栈指的就是操作数栈。

操作数栈执行流程

对以下java代码

public void testAddOperation() {
    //byte、short、char、boolean：都以int型来保存
    byte i = 15;
    int j = 8;
    int k = i + j;
}

字节码指令如下：

 0 bipush 15
 2 istore_1
 3 bipush 8
 5 istore_2
 6 iload_1
 7 iload_2
 8 iadd
 9 istore_3
10 return

执行流程图示：

0 bipush 15
首先执行第一条语句，PC寄存器指向的是0，也就是指令地址为0，然后使用bipush让操作数15入操作数栈。
执行完后PC寄存器指针下移
2 istore_1
将15存到局部变量表索引为1的位置，然后操作数栈出栈。PC指向下一行
（索引为0的位置存的是this
3 bipush 8 5 istore_2
iload_1 iload_2
iload_1：把局部变量表索引为1的值入栈到操作数栈
iload_2：
把局部变量表索引为2的值入栈到操作数栈
iadd
将操作数栈中的两个元素执行相加操作，存到操作数栈中
istore_3
将操作数栈栈顶元素存储在局部变量表3的位置，并出栈

int i = 8

我们定义的是int i =8，由于byte可以存下8，所以我们可以看到bipush 8 是把8作为byte入到操作数栈的，而istore存到局部变量表的时候还是用的int

在这里插入图片描述

i++和++i

i++
先将 i 的值加载到操作数栈，再将 i 的值加 1
++i
先将 i 的值加 1，在将 i 的值加载到操作数栈

栈顶缓存技术

基于栈式架构的虚拟机所使用的零地址指令更加紧凑，但完成一项操作的时候必然需要使用更多的入栈和出栈指令，这同时也就意味着将需要更多的指令分派（instruction dispatch）次数和内存读/写次数。
由于操作数是存储在内存中的，因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个问题，HotSpot JVM的设计者们提出了栈顶缓存（Tos，Top-of-Stack Cashing）技术，将栈顶元素全部缓存在物理CPU的寄存器中，以此降低对内存的读/写次数，提升执行引擎的执行效率。
寄存器的主要优点：指令更少，执行速度快

动态链接（指向运行时常量池的方法引用）

在这里插入图片描述

每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用，这就是动态链接
通过动态链接就知道你调的方法是哪个方法
在Java源文件被编译到字节码文件中时，所有的变量和方法引用都作为符号引用（Symbolic Reference）保存在class文件的常量池里，动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用
常量池：

为什么要用常量池呢？
- 因为在不同的方法，都可能调用常量或者方法，所以只需要存储一份即可，然后记录其引用即可，节省了空间
- 常量池的作用：就是为了提供一些符号和常量，便于指令的识别

方法返回地址

方法返回地址是用来存放调用该方法的pc寄存器的值的
就是方法A调了方法B后，方法B 结束执行引擎要知道该去调哪里，这时方法返回地址只要把方法A的pc寄存器的值存下来，那执行引擎通过方法返回地址就去调方法A对应的地方了。
无论通过哪种方式退出，在方法退出后都返回到该方法被调用的位置。方法结束的两种方式
- 正常执行完成
  方法正常退出时，调用者的pc计数器的值作为返回地址，即调用该方法的指令的下一条指令的地址。
  一个方法在正常调用完成之后，究竟需要使用哪一个返回指令，还需要根据方法返回值的实际数据类型而定。
  ireturn：当返回值是boolean，byte，char，short和int类型时使用
  lreturn：Long类型
  freturn：Float类型
  dreturn：Double类型
  areturn：引用类型
  return：返回值类型为void的方法、实例初始化方法、类和接口的初始化方法
- 出现未处理的异常，非正常退出
  而通过异常退出的，返回地址是要通过异常表来确定，栈帧中一般不会保存这部分信息。
  异常表：
本质上，方法的退出就是当前栈帧出栈的过程。此时，需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置PC寄存器值等，让调用者方法继续执行下去。
正常完成出口和异常完成出口的区别在于：通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。

一些附加信息

不一定会有
栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如：对程序调试提供支持的信息。

方法的调用

静态链接与动态链接

在JVM中，将符号引用转换为调用方法的直接引用与方法的绑定机制相关。根据转换的时机可以分为静态链接和动态链接。

静态链接

当一个字节码文件被装载进JVM内部时，如果被调用的目标方法在编译期确定，且运行期保持不变时，这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接

动态链接

如果被调用的方法在编译期无法被确定下来==，也就是说，只能够在程序运行期将调用的方法的符号转换为直接引用==，由于这种引用转换过程具备动态性，因此也被称之为动态链接。

早期绑定与晚期绑定

静态链接和动态链接对应的方法的绑定机制为：早期绑定（Early Binding）和晚期绑定（Late Binding）。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程，这仅仅发生一次。

早期绑定

早期绑定就是指被调用的目标方法如果在编译期可知，且运行期保持不变时，即可将这个方法与所属的类型进行绑定，这样一来，由于明确了被调用的目标方法究竟是哪一个，因此也就可以使用静态链接的方式将符号引用转换为直接引用。
在这里插入图片描述
invokespecial 体现为早期绑定

晚期绑定

如果被调用的方法在编译期无法被确定下来，只能够在程序运行期根据实际的类型绑定相关的方法， 这种绑定方式也就被称之为晚期绑定。
在这里插入图片描述
invokeinterface 体现为晚期绑定

invokevirtual 体现为晚期绑定

虚方法与非虚方法

如果方法在编译期就确定了具体的调用版本，这个版本在运行时是不可变的。这样的方法称为非虚方法。
静态方法、私有方法、fina1方法、实例构造器、父类方法都是非虚方法。
子类对象的多态的使用前提：
- 类的继承关系
- 方法的重写
  静态方法、私有方法、final方法都不能被重写，自然不具有多态性，也就是提前能确定下来的，所以是虚方法
其他方法称为虚方法。

虚拟机中调用方法的指令

其中invokestatic指令和invokespecial指令调用的方法称为非虚方法，其余的（fina1修饰的除外）称为虚方法。

四条普通指令：
前四条指令固化在虚拟机内部，方法的调用执行不可人为干预
- invokestatic：调用静态方法，解析阶段确定唯一方法版本非虚方法
- invokespecial：调用方法、私有及父类方法，解析阶段确定唯一方法版本非虚方法
- invokevirtual：调用所有虚方法
- invokeinterface：调用接口方法
一条动态调用指令
invokedynamic指令则支持由用户确定方法版本
- invokedynamic：动态解析出需要调用的方法，然后执行
  - JVM字节码指令集一直比较稳定，一直到Java7中才增加了一个invokedynamic指令，这是Java为了实现【动态类型语言】支持而做的一种改进。
    动态类型语言和静态类型语言的区别就是对类型的检查是在编译期还是运行期。
    - 静态类型语言
      JAVA属于静态类型语言。静态类型语言是判断变量自身的类型信息
    - 动态类型语言
      动态类型语言是判断变量值的类型信息，变量并没有类型信息。
  - Java7中增加的动态语言类型支持的本质是对Java虚拟机规范的修改，而不是对Java语言规则的修改，这一块相对来讲比较复杂，增加了虚拟机中的方法调用，最直接的受益者就是运行在Java平台的动态语言的编译器。
  - 但是在Java7中并没有提供直接生成invokedynamic指令的方法，需要借助ASM这种底层字节码工具来产生invokedynamic指令。直到Java8的Lambda表达式的出现，invokedynamic指令的生成，在Java中才有了直接的生成方式。

方法重写

Java 语言中方法重写的本质：

找到操作数栈顶的第一个元素所执行的对象的实际类型，记作C。
如果在类型C中找到与常量中的描述符合简单名称都相符的方法，则进行访问权限校验
1. 如果通过则返回这个方法的直接引用，查找过程结束
2. 如果不通过，则返回java.1ang.IllegalAccessError 异常
  1. 程序试图访问或修改一个属性或调用一个方法，这个属性或方法，你没有权限访问。
  2. 一般的，这个会引起编译器异常。这个错误如果发生在运行时，就说明一个类发生了不兼容的改变。
    比如，你把应该有的jar包放从工程中拿走了，或者Maven中存在jar包冲突
否则，按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。
如果始终没有找到合适的方法，则抛出java.lang.AbstractMethodError异常。

虚方法表

在面向对象的编程中，会很频繁的使用到动态分派，如果在每次动态分派的过程中都要重新在类的方法元数据中搜索合适的目标的话就可能影响到执行效率。
因此，为了提高性能，JVM采用在类的方法区建立一个虚方法表（virtual method table）来实现，使用索引表来代替查找。非虚方法不会出现在表中。
每个类中都有一个虚方法表，表中存放着各个方法的实际入口。
虚方法表会在类加载的链接阶段被创建并开始初始化，类的变量初始值准备完成之后，JVM会把该类的虚方法表也初始化完毕。

也就是虚方法表中放了每个方法应该去具体调的方法，这样不用每次调的时候都要一层一层向上找。
在这里插入图片描述

虚拟机栈相关面试题

举例栈溢出的情况
StackOverflowError
调整栈大小，就能保证不出现溢出么？
不能保证不溢出，对于一直递归的，或者调整更大我运行更多次也是会溢出的。
分配的栈内存越大越好么？
不是。内存空间是有限的，栈内存越大那其他东西分配的空间就会相应减少，可能会引起线程数减少。
垃圾回收是否涉及到虚拟机栈？
不会。
运行时数据区的哪些部分存在Error和GC
方法中定义的局部变量是否线程安全？
具体问题具体分析，如果对象是在内部产生，并在内部消亡，没有返回到外部，那么它就是线程安全的，反之则是线程不安全的。
什么是线程安全？
- 如果只有一个线程才可以操作此数据，则必是线程安全的。
  - StringBuilder只存在方法的内部
    method1() 被一个线程调了以后，method1()就是在这个线程的虚拟机栈一个栈帧，s1在这个栈帧中，当然也不会被其他线程调用，所以是线程安全的。
  - StringBuilder只存在方法的内部
- 如果有多个线程操作此数据，则此数据是共享数据。如果不考虑同步机制的话，就会存在线程安全问题。
  - sBuilder是从外面传过来的，有可能被多个线程调用，所以是线程不安全
    
    即下面用两个线程都用到了s
  - StringBuilder返回出去了