PC寄存器和虚拟机栈

最新推荐文章于 2024-11-24 21:46:30 发布

原创最新推荐文章于 2024-11-24 21:46:30 发布 · 521 阅读

3 ·

CC 4.0 BY-SA版权

java原理专栏收录该内容

7 篇文章

订阅专栏

本文详细介绍了JVM的运行时数据区中的PC寄存器和虚拟机栈。PC寄存器用于存储下一条指令地址，确保线程切换后能正确执行。虚拟机栈则按方法调用创建栈帧，存储局部变量和操作数，每个线程拥有独立的虚拟机栈。栈帧在方法调用和返回时动态调整，局部变量表和操作数栈分别管理变量和计算过程。方法调用涉及动态链接和方法重写，而虚方法表优化了动态分派的性能。

上篇我们学习了类加载子系统，这篇我们来介绍一下运行时数据区中的pc寄存器和虚拟机栈的细节内容介绍。

1.程序计数器（PC寄存器）

JVM中的程序计数器（寄存器Program Counter Register），Register的命名来源于CPU的寄存器，寄存器存储指令相关的信息。CPU

只把数据装载到寄存器才能运行。JVM中的PC寄存器是对物理PC寄存器的一种抽象模拟。

1.1 作用

PC寄存器是用来存储指向下一条指令的地址，即将要执行的指令代码。由执行引擎读取下一条指令。

它是一块很小的内存空间，几乎可以忽略不计。也是运行速度最快的存储区域
在jvm规范中，每个线程都有自己的程序计数器，是线程私有的。生命周期和线程保持一致.
任何时间一个线程都只有一个方法在执行，也就是所谓的当前方法。程序计数器会存储当前线程正在执行的java方法的JVM指令地址，或者如果执行native方法，则是未指定值（undefined）
它是程序的控制流的指示器，分支，循环，跳转，异常处理，线程恢复等功能都需要这个计数器来完成。
字节码解释器工作时就是通过改变这个计数器的值来选取下一步需要执行的字节码指令
此外，寄存器也是java虚拟机中唯一一个没有OOM的区域

1.2代码示例

利用javap -v xxx.class 反编译字节码文件，查看指令等信息

1.3面试常问

1.pc寄存器存储字节码指令地址有什么作用？

因为cpu要不断切换各个线程，切换回来就要知道要从哪开始执行，JVM的字节码解释器就通

过改变pc寄存器的值来确定下一天指令应该执行什么样的字节码指令.

2.pc寄存器为啥要设计成线程私有?

我们都知道所谓的多线程在一个特定的时间段内指回执行其中某一个线程的方法，CPU会不停滴做任务切换，这样必然会导致经常中断或恢复，如何保证分毫无差呢？为了能够准确地记录各个线程正在执行的当前字节码指令地址，最好的办法自然是为每一个线程都分配一个PC寄存器,这样一来各个线程之间便可以进行独立计算，从而不会出现相互干扰的情况。
由于CPU时间片轮限制，众多线程在并发执行过程中，任何一个确定的时刻，一个处理器或者多核处理器中的一个内核，只会执行某个线程中的一条指令。
这样必然导致经常中断或恢复，如何保证分毫无差呢？每个线程在创建后，都会产生自己的程序计数器和栈帧，程序计数器在各个线程之间互不影响。

CPU时间片

CPU时间片，即CPU分配各个程序的时间，每个线程被分配一个时间段。称作它的时间片

在宏观上：我们可以同时打开多个应用程序，每个程序并行不悖，同时运行。但在微观上，由于只有一个CPU，一次只能处理程序要求的一部分，如何公平处理，一种方法就是引入时间片，每个程序轮流执行。

并行与并发

并行：同一时刻多个线程同时执行

并发：一个核快速切换多个线程，让他们依次执行，看起来像并行，实际上是并发

2.虚拟机栈

2.1 什么是虚拟机栈

java虚拟机栈（Java Virtual Machine Stack），早期也叫Java栈。每个线程在创建时都会创建一个虚拟机栈，其内部保存一个个栈帧，对应这个一次次的 java调用。他是线程私有的
它的生命周期和线程是一致的
作用：主管java程序的运行，保存方法的局部变量（八种基本数据类型，对象的引用地址），并参与方法的调用和返回

2.2 内存中的栈

栈是运行时单位，而堆是存储单位即：栈管运行，堆管存储。
一般来讲，对象主要放在堆空间，是运行时数据区比较大的一块
栈空间存放，基本数据类型的局部变量，以及引用数据类型的对象引用

2.3 栈的特点

栈是一种快速有效的分配存储方式，访问速度仅次于pc寄存器
JVM直接对java栈的操作只有：入栈和压栈
对栈来说，不存在垃圾回收问题

2.4 栈中可能出现的异常

java虚拟机规范允许Java栈的大小是动态的或者是固定不变的

如果采用固定大小的Java虚拟机栈，那每一个线程的java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过java虚拟机栈允许的最大容量，java虚拟机将会抛出一个 StackOverFlowError异常

如果java虚拟机栈可以动态拓展，并且在尝试拓展的时候无法申请到足够的内存，或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈，那java虚拟机将会抛出一个 OutOfMemoryError异常

2.5设置栈的内存大小 -Xss256k

3栈的存储结构和运行原理

3.1栈帧是什么？

每个线程都有自己的栈帧，栈中的数据都是以栈帧的格式存在
线程上执行的每个方法都会有一个自己的栈帧
栈帧是一个内存区块，是一个数据集，维系着方法执行过程中的各种数据信息
在一条活动线程中，一个时间点上，只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧（栈顶栈帧）是有效的，这个栈帧被称为当前栈帧(Current Frame),与当前栈帧对应的方法就是当前方法（Current Frame）
执行引擎运行的所有字节码指令只针对当前栈帧进行操作
如果再该方法中调用了其他方法，对应的新的栈帧就会被创建出来，放在栈的顶端，成为新的当前栈帧
不同线程中所包含的栈帧是不允许相互引用的，即不可能一个栈帧中，引用另外一个线程的栈帧
如果当前方法调用了其他方法，方法返回之际，当前栈帧会传回此方法的执行结果给前一个栈帧，接着，虚拟机会丢弃当前栈帧，使得前一个栈帧重新成为当前栈帧
java方法有两种返回函数方式，一种是正常的函数返回，使用return指令，另外一种是抛出异常。不管哪种方式，都会导致栈帧被弹出

3.2栈帧的内部结构

局部变量表（Local Variables 简称LV）
操作数栈或者表达式栈（Operand Stack 简称OS）
动态链接或者运行时常量池的方法引用（Dynamic Liking）
方法的返回地址（Return Address）
一些附加信息

3.3局部变量表

局部变量表也被称作局部变量数组或者本地变量表
定义一个数字数组，主要用于存放方法参数和定义在方法体内的局部变量这些数据类型包括各类型基本数据类型，对象引用，以及return adress
由于局部变量表是建立在对象的栈上，是线程私有数据，因此不存在数据安全问题
局部变量表所需要的容量大小是在编译期间就定义好的，并保存在方法的Code属性的maximum local variables 数据项中。方法运行期间，不会改变局部变量表的大小的
方法嵌套调用的次数由栈的大小决定。一般来说，栈越大，方法嵌套调用次数越多。对一个函数而言，他的参数和局部变量越多，使得局部变量表膨胀，它的栈帧就越大，以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间，导致其嵌套调用次数就会减少。
局部变量表中的变量只在当前的方法调用中有效。在方法执行时，虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后随着方法栈帧的销毁而随之销毁

利用javap命令对字节码文件进行解析查看，局部变量表:

也可以在IDEA 上安装jclasslib byte viewcoder插件查看字节码信息,以main()方法为例

3.4变量槽slot的理解与演示

参数值的存放总是在局部变量表数组的index0开始，到数组长度的-1的索引结束
局部变量表，最基本的存储单元是Slot（变量槽）
局部变量表中存放编译期可知的各种基本数据类型（8种），引用类型（reference），returnAddress类型的变量
在局部变量表里，32位以内的类型只占一个slot（包括returnAddress类型），64位的类型（long和dubbo）占两个slot

JVM会为局部变量表中的每一个Slot都分配一个访问索引，通过这个索引即可成功访问到局部变量表中指定的局部变量值
当一个实例方法被调用的时候，它的方法参数和方法体内部定义的局部变量将会按照顺序复制到局部变量表中的每一个Slot上
如果需要访问局部变量表中一个64bit的局部变量值时，只需要使用前一个索引即可
如果当前帧是由构造方法或者实例方法创建的，那么该对象引用this将会存放在index为0的slot处，其余的参数按照参数表顺序排列

3.5 solt的重复利用

栈帧中的局部变量表中的槽位是可以重用的，如果一个局部变量过了其作用域，那么在其作用域之后声名的新的局部变量就很有可能会复用过期局部变量的槽位，从而达到节省资源的目的。

4 操作数栈

操作数栈，主要用于保存计算过程的中间结果，同时作为计算过程中变量临时的存储空间。
操作数栈就是jvm执行引擎的一个工作区，当一个方法开始执行的时候，一个新的栈帧也会随之被创建出来，这个方法的操作数栈是空的
每一个操作数栈都会拥有一个明确的栈深度用于存储数值，其所需的最大深度在编译器就定义好了，保存在方法的code属性中，为max_stack的值。
栈中的任何一个元素都是可以任意的java数据类型
- 32bit的类型占用一个栈单位深度
- 64bit的类型占用两个栈深度单位
操作数栈并非采用访问索引的方式来进行数据访问的，而是只能通过标砖的入栈push和出栈pop操作来完成一次数据访问
如果被调用的方法带有返回值的话，其返回值将会被压入当前栈帧的操作数栈中，并更新PC寄存器中下一条需要执行的字节码指令。
操作数栈中的元素的数据类型必须与字节码指令的序列严格匹配，这由编译器在编译期间进行验证，同时在类加载过程中的类验证阶段的数据流分析阶段要再次验证。
另外，我们说Java虚拟机的解释引擎是基于栈的执行引擎,其中的栈指的就是操作数栈。
结合上图结合下面的图来看一下一个方法（栈帧）的执行过程

4.1栈顶缓存技术ToS（Top-of-Stack Cashing）

基于栈式架构的虚拟机所使用的零地址指令更加紧凑，但完成一项操作的时候必然需要使用更多的入栈和出栈指令，这同时也就意味着将需要更多的指令分派（instruction dispatch）次数和内存读/写次数
由于操作数是存储在内存中的，因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个问题，HotSpot JVM的设计者们提出了栈顶缓存技术，将栈顶元素全部缓存在屋里CPU的寄存器中，以此降低对内存的读/写次数，提升执行疫情的执行效率

5 动态链接

每一个栈帧内部都包含一个指向运行时常量池或者该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接。比如invokedynamic指令
在java源文件被编译成字节码文件中时，所有的变量和方法引用都作为符号引用，保存在class文件的常量池里，比如描述一个方法调用其他方法时，就是通过常量池指向方法的符号引用来表示的，那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用

为什么需要常量池呢
常量池的作用，就是为了提供一些符号和常量，便于指令的识别。

5.2 方法调用

** 在JVM中，将符号引用转换为调用方法的直接引用与方法的绑定机制相关 **

静态链接
当一个字节码文件被装载进JVM内部时，如果被调用的目标方法在编译期可知，且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接。
动态链接
如果被调用的方法在编译期无法被确定下来，也就是说，只能够在程序运行期将调用方法的符号引用转换为直接引用，由于这种引用转换过程具备动态性，因此也就被称之为动态链接。

对应的方法的绑定机制为：早起绑定（Early Binding）和晚期绑定（Late Bingding）。绑定是一个字段、方法或者类在符号引用被替换为直接引用的过程，这仅仅发生一次。

早期绑定
早期绑定就是指被调用的目标方法如果在编译期可知，且运行期保持不变时，即可将这个方法与所属的类型进行绑定，这样一来，由于明确了被调用的目标方法究竟是哪一个，因此也就可以使用静态链接的方式将符号引用转换为直接引用。
晚期绑定
如果被调用的方法在编译期无法被确定下来，只能够在程序运行期根据实际的类型绑定相关的方法，这种绑定方式也就被称之为晚期绑定。

随着高级语言的横空出世，类似于java一样的基于面向对象的编程语言如今越来越多，尽管这类编程语言在语法风格上存在一定的差别，但是它们彼此之间始终保持着一个共性，那就是都支持封装，集成和多态等面向对象特性，既然这一类的编程语言具备多态特性，那么自然也就具备早期绑定和晚期绑定两种绑定方式。
Java中任何一个普通的方法其实都具备虚函数的特征，它们相当于C++语言中的虚函数（C++中则需要使用关键字virtual来显式定义）。如果在Java程序中不希望某个方法拥有虚函数的特征时，则可以使用关键字final来标记这个方法。

5.3虚方法和非虚方法

子类对象的多态性使用前提：①类的继承关系②方法的重写

非虚方法:

方法在编译期就确定了具体的调用版本，这个版本在运气是是不可变的
静态方法，私有方法，final方法，实例构造器，父类方法都是非虚方法

虚拟机中提供了以下几条方法调用指令：

普通调用指令：
1.invokestatic：调用静态方法，解析阶段确定唯一方法版本；
2.invokespecial:调用方法、私有及弗雷方法，解析阶段确定唯一方法版本；
3.invokevirtual调用所有虚方法；
4.invokeinterface：调用接口方法；
动态调用指令：
5.invokedynamic：动态解析出需要调用的方法，然后执行 .
前四条指令固化在虚拟机内部，方法的调用执行不可人为干预，而invokedynamic指令则支持由用户确定方法版本。其中invokestatic指令和invokespecial指令调用的方法称为非虚方法，其余的（final修饰的除外）称为虚方法。

关于invokedynamic指令

JVM字节码指令集一直比较稳定，一直到java7才增加了一个invokedynamic指令，这是Java为了实现【动态类型语言】支持而做的一种改进
但是java7中并没有提供直接生成invokedynamic指令的方法，需要借助ASM这种底层字节码工具来产生invokedynamic指令.直到Java8的Lambda表达式的出现，invokedynamic指令的生成，在java中才有了直接生成方式
Java7中增加的动态语言类型支持的本质是对java虚拟机规范的修改，而不是对java语言规则的修改，这一块相对来讲比较复杂，增加了虚拟机中的方法调用，最直接的受益者就是运行在java凭条的动态语言的编译器

动态类型语言和静态类型语言

动态类型语言和静态类型语言两者的却别就在于对类型的检查是在编译期还是在运行期，满足前者就是静态类型语言，反之则是动态类型语言。
直白来说 静态语言是判断变量自身的类型信息；动态类型预言师判断变量值的类型信息，变量没有类型信息，变量值才有类型信息,这是动态语言的一个重要特征
Java是静态类型语言（尽管lambda表达式为其增加了动态特性），js，python是动态类型语言.

5.4方法重写的本质

找到操作数栈的第一个元素所执行的实际对象，记作C。
如果在类型C中与常量中的描述符合简单名称都相符的方法，则进行权限校验，如果通过则返回这个方法的直接引用，查找过程结束，如果不通过，则返回java.lang.IllegalAccessError异常。
否则，按照继承关系关系从下往上依次对c的各个父类进行第二步的搜索和验证过程
如果始终没有找到合适的方法，则抛出java.lang.AbstractMethodError异常。

5.5虚方法表

在面向对象编程中，会很频繁期使用到动态分派，如果在每次动态分派的过程中都要重新在累的方法元数据中搜索合适的目标的话就可能影响到执行效率。因此，为了提高性能，jvm采用在类的方法区建立一个虚方法表（virtual method table）（非虚方法不会出现在表中）来实现。使用索引表来代替查找。
每个类中都有一个虚方法表，表中存放着各个方法的实际入口。
那么虚方法表什么时候被创建？虚方法表会在类加载的链接阶段被创建并开始初始化，类的变量初始值准备完成之后，jvm会把该类的方发表也初始化完毕。

5.6方法的返回地址

存放调用该方法的PC寄存器的值。
一个方法的结束，有两种方式：
- 正常执行完成
- 出现未处理的异常，非正常退出
无论通过哪种方式退出，在方法退出后都返回到该方法被调用的位置。方法正常退出时，调用者的pc计数器的值作为返回地址，即调用该方法的指令的下一条指令的地址。而通过异常退出时，返回地址是要通过异常表来确定，栈帧中一般不会保存这部分信息。
本质上，方法的退出就是当前栈帧出栈的过程。此时，需要恢复上层方法的局部变量表、操作数栈、将返回值也如调用者栈帧的操作数栈、设置PC寄存器值等，让调用者方法继续执行下去。
正常完成出口和异常完成出口的区别在于：通过异常完成出口退出的不会给他的上层调用者产生任何的返回值