双亲委派机制
Java虚拟机对class文件采用的是按需加载的方式,也就是说当需要使用该类时才会将它的class文件加载到内存生成class对象。而且加载某个类的 class文件时,Java虚拟机采用的是双亲委派模式,即把请求交由父类处理,它是一种任务委派模式。
那么我们可以发现,string的路径是在java.lang包下的,那么我们新建一个java.lang的包在我们自己创建的包下创建一个String类,然后在测试类中new一个String会发生什么呢?是系统的string还是我们自己创建的string呢? 好,那么我们接下来来测试一下吧
package java.lang;
public class String {
static {
System.out.println("自己定义的string类正在初始化");
}
}
package com.project.test;
public class stringTest {
public static void main(String[] args) {
java.lang.String name = new java.lang.String();
System.out.println("hello string");
}
}
那么运行是什么结果呢?总所周知静态代码块在运行时候会第一个执行,那么这段运行会不会有这段话吗?如下:
那么他是不会执行的,为什么呢?那这就得看看双亲委派的工作原理了。
工作原理
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行;
- 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器;
- 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式。
那么我们可以想一下如果在我们自己创建的string类中写个main方法在运行一下会出现什么情况呢?那我们来试一下
package java.lang;
public class String {
static {
System.out.println("自己定义的string类正在初始化");
}
public static void main(String[] args) {
System.out.println("hello");
}
}
运行一下 如下:
优点
那么上面那个问题就是我们要讲到双亲委派的优点了
避免类的重复加载保护程序安全,防止核心API被随意篡改
沙箱安全机制
自定义string类,但是在加载自定义string类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载idk自带的文件(rt.jar包中javallang\String.class),报错信息说没有main方法就是因为加载的是rtjar包中的string类。这样可以保证对java核心源代码的保护,这就是沙箱安全机制。
扩展
在JVM中表示两个qass对象是否为同一个类存在两个必要条件:
- 类的完整类名必须一致,包括包名。
- 加载这个类的classLoader(指ClassLoader实例对象)必须相同。
换句话说,在JVM中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的ClassLoader实例对象不同,那么这两个类对象也是不相等的。
对加载器的引用
JVM必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么JVM会将这个类加载器的一个引用作为类型信息的一部介保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的。
主动使用和被动使用
主动使用,又分为七种情况:
- 创建类的实例
- 访问某个类或接口的静态变量,或者对该静态变量赋值调用类的静态方法
- 反射(比如:Class.forName(“com.atguigu.Test"))
- 初始化一个类的子类
- Java虚拟机启动时被标明为启动类的类 JDK7开始提供的动态语言支持:
- java.lang.invokeMethodHandle实例的解析结果
- REF getstatic REFputstatic REFinvokeStatic句柄对应的类没有初始化,则初始化。
除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化。
数据区内部结构
内存是非常重要的系统资源,是硬盘和CPU的中间仓库及桥梁,承载着操作系统和应用程序的实时运行。JVM内存布局规定了Java在运行过程中内存申请、分配、管理的策略,保证了JVM的高效稳定运行。不同的JVM对于内存的划分方式和管理机制存在着部分差异。结合JVM虚拟机规范,来探讨一下经典的JVM内存布局。
线程
Java虚拟机定义了若干种程序运行期间会使用到的运行时数据区,其中有一些会随着虚拟机启动而创建,随着虚拟机退出而销毁。另外一些则是与线程一一对应的,这些与线程对应的数据区域会随着线程开始和结束而创建和销毁。
灰色的为单独线程私有的,红色的为多个线程共享的。即:
- 每个线程:独立包括程序计数器、栈、本地栈。
- 线程间共享:堆、堆外内存(永久代或元空间、代码缓存)
线程是一个程序里的运行单元。JVM允许一个应用有多个线程并行的执行。
在HotspotJVM里,每个线程都与操作系统的本地线程直接映射。
- 当一个Java线程准备好执行以后,此时一个操作系统的本地线程也同时创建。Java线程执行终止后,本地线程也会回收。
操作系统负责所有线程的安排调度到任何一个可用的CPU上。一日本地线程初始化成功,它就会调用Java线程中的run(()方法。
JVM系统线程
如果你使用iconsole或者是任何一个调试工具,都能看到在后台有许多线程在运行。这些后台线程不包括调用public staticvoidmain(string[])的main线程以及所有这个main线程自己创建的线程。
这些主要的后台系统线程在HotspotJVM里主要是以下几个:
- 虚拟机线程:这种线程的操作是需要JVM达到安全点才会出现。这些操作必须在不同的线程中发生的原因是他们都需要JVM达到安全点,这样堆才不会变化。这种线程的执行类型包括“stop-the-world”的垃圾收集,线程械收集,线程挂起以及偏向锁撤销。
- 周期任务线程:这种线程是时间周期事件的体现(比如中断),他们一般用于周期性操作的调度执行。
- GC线程:这种线程对在JVM里不同种类的垃圾收集行为提供了支持。编译线程:这种线程在运行时会将字节码编译成到本地代码。
- 信号调度线程:这种线程接收信号并发送给JVM,在它内部通过调用适当的方法进行处理。
PC寄存器
介绍:
JVM中的程序计数寄存器(Program Counter Register)中, Register的命名源于
CPU的寄存器,寄存器存储指令相关的现场信息。 CPU只有把数据装载到寄存器才能够运行。
这里,并非是广义上所指的物理寄存器,或许将其翻译为PC计数器(或指令计数器)会更加贴切(也称为程序钩子),并且也不容易引起一些不必要的误会。JVM中的PC寄存器是对物理PO寄存器的一种抽象模拟。
- 它是一块很小的内存空间,几乎可以忽略不记。也是运行速度最快的存储区域。
- 在JVM规范中,每个线程都有它自己的程序计数器,是线程私有的,生命周期与线程的生命周期保持一致。
- 任何时间一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的Java方法的JVM指令地址:或者,如果是在执行native方法,则是未指定值(undefned)。
- 它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成
- 字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行白字节码指令。
- 它是唯一一个在Java虚拟机规范中没有规定任何OutotMemoryError情况的区域。
作用:
PC寄存器用来存储指向下一条指令的地址,也即将要执行的指令代码。由执行引擎读取下一条指令。
面试问题
使用PC寄存器存储字节码指令地址有什么用呢?为什么使用PC寄存器记录当前线程的执行地址呢?
解答:
- 因为CPU需要不停的切换各个线程,这时候切换回来以后,就得知道接着从哪开始继续执行。
- JVM的字节码解释器就需要通过改变PC寄存器的值来明确下一条应该执行什么样的字节码指令。
PC寄存器为什么会被设定为线程私有?
- 我们都知道所谓的多线程在一个特定的时间段内只会执行其中某一个线程的方法,CPU会不停地做任务切换,这样必然导致经常中断或恢复,如何保证分毫无差呢?为了能够准确地记录各个线程正在执行的当前字节码指令地址,最好的办法自然是为每一个线程都分配一个PC寄存器,这样一来各个线程之间便可以进行独立计算,从而不会出现相互干扰的情况。
- 由于CPU时间片轮限制,众多线程在并发执行过程中,任何一个确定的时刻,一个处理器或者多核处理器中的一个内核,只会执行某个线程中的一条指令。
- 这样必然导致经常中断或恢复,如何保证分毫无差呢?每个线程在创建后,都会产生自己的程序计数器和栈帧,程序计数器在各个线程之间互不影响。
虚拟机栈
优点
- 由于跨平台性的设计,Java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的。
- 优点是跨平台,指令集小,编译器容易实现,缺点是性能下降,实现同样的功能需要更心的指令。
- 栈是一种快速有效的分配存储方式,访问速度仅次于程序计数器。
- 对于栈来说不存在垃圾回收问题
- JVM直接对Java栈的操作只有两个:
- 每个方法执行,伴随着进栈(入栈、压栈)
- 执行结束后的出栈工作
内存中的堆和栈
栈是运行时的单位,而堆是存储的单位。
即:找解决程序的运行问题,即程序如何执行,或者说如何处理数据。堆解决的是数据存储的问题,即数据怎么放、放在哪儿。
虚拟机栈的基本内容
Java虚拟机栈是什么?
- Java虚拟机栈(Java Virtual MachineStack),早期也叫Java栈。每个线程在创建时都会创建一个虚拟机栈,其内部保存一个个的栈帧(Stack Frame),对应着一次次的Java方法调用。>是线程私有的
生命周期
- 生命周期和线程一致。
作用
主管Java程序的运行,它保存方法的局部变量、部分结果,并参与方法的调用和返回。
- 局部变量vs成员变量(或属性)
- 基本数据变量vs引用类型变量(类数组、接口)
栈的大小
- Java 虚拟机规范允许Java栈的大小是动态的或者是固定不变的。
- 如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,Java虚拟机将会抛出一个 StackoverflowError 异常。
- 如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈。那Java虚拟机将会抛出一个 OutOfMemoryError 异常。
我们在main方法里面调用main看看会出什么情况呢?
javapackage com.project.test;
// 默认栈大小 11404
// 设置栈大小:-Xss256k 2465
public class StackErrorTest {
private static int a = 1;
public static void main(String[] args) {
System.out.println(a);
a++;
main(args);
}
}
结果如下:
栈中存储什么
- 每个线程都有自己的栈,栈中的数据都是以栈帧(stack Frame)的格式存在。
- 在这个线程上正在执行的每个方法都各自对应一个栈帧(Stack Frame)。
- 栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各种数据信息。
栈运行原理
- JVM直接对Java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循“先进后出”/“后进先出”原则。
- 在一条活动线程中,一个时间点上,只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,这个栈帧被称为当前栈帧(current Frame),与当前栈帧相对应的方法就是当前方法(current Method),定义这个方法的类就是当前类(current Class)。
- 执行引擎运行的所有字节码指令只针对当前栈帧进行操作。
- 如果在该方法中调用了其他方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的当前帧。
我们可以写个代码看看运行结果和顺序:
package com.project.test;
public class test {
public static void main(String[] args) {
test test = new test();
test.method1();
}
public void method1(){
System.out.println("方法一执行");
method2();
System.out.println("方法一结束");
}
private void method2() {
System.out.println("方法二执行");
method3();
System.out.println("方法二结束");
}
private void method3() {
System.out.println("方法三执行");
System.out.println("方法三结束");
}
}
结果:
栈的内部结构
每个栈帧中存储着:
- 局部变量表(Local Variables)
- 操作数栈(Operand stack)(或表达式栈)
- 动态链接(DynamicLinking)(或指向运行时常量池的方法引用)
- 方法返回地址(ReturnAddress)(或方法正常退出或者异常退出的定义)一些附加信息
局部变量表
- 局部变量表也被称之为局部变量数组或本地变量表
- 定义为一个数字数组,主要用于存们方法参数和定义在方法体内的局部变量这些数据类型包括各类基本数据类型、对象引用(reference),以及 returnAddress类型。
- 由于局部变量表是建立在线程的栈上,是线程的私有数据,因此不存在数据安全问题
- 局部变量表所需的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum localvariables数据项中。在方法运行期间是不会改变局部变量表的大小的。
- 方法嵌套调用的次数由栈的大小决定。一般来说,栈越大,方法嵌套调用次数越多。对一个函数而言,它的参数和局部变量越多,使得局部变量表膨胀。它的栈帧就越大,以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间,导致其嵌套调用次数就会减少。
- 局部变景表中的变量只在当前方法调用中有效。在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。
最后放上我们jvm的反编译的重要的东西,查看指令和栈和方法的一些操作: