一、概述:
类加载机制:校验,转换解析和初始化,最终形成可被虚拟机使用的Java类型,这就是虚拟机的类加载机制。
二、类加载的生命周期:
加载——>验证——>准备——>解析——>初始化——>使用——>卸载
其中验证,准备和解析他们合称为链接过程。
三、加载:
1、通过类的全限定名获取该类的的二进制字节流;
2、将字节流所代表的静态存储结构转化为方法区的运行时数据结构;
3、生成代表该类的Class对象并存放方法区,作为方法区该类的各种数据的访问入口。
对于上述字节流,可能来源:
- 压缩包,例如jar/war等格式;
- 网络,典型场景applet;
- 运行时计算生成,例如动态代理技术,在java.lang.reflect.Proxy中,利用ProxyGenerator.generateProxyClass来为特定接口生成形如“*$Proxy”的代理类的二进制字节流;
- 数据库,例如中间件服务器(SAP Netweaver)。
四、验证
验证是连接阶段(Linking)的第一步,目的是为了确保Class文件的字节流符合虚拟机规范,不会危害虚拟机自身安全。比如:访问数组越界问题,将对象转型为未实现的类型,跳转到不存在的代码区等情绪编译器都会拒绝编译,也就是无法生成Class文件,既然如此,为什么还要验证呢?原因是Class文件不一定都是由java源码编译而成,可以是任何途径,所以验证还是很有必要的,尽可能保证系统能承受住恶意代码攻击。
验证主要工作分为四个阶段:
1、文件格式的验证:验证是否符合Class文件格式规范;
2、元数据验证:验证是否符合Java语言规范;
3、字节验证:验证数据流和控制流分析;
4、符号引用验证:验证符号引用转化为直接引用。
五、解析:
主要工作:虚拟机将常量池内的符号引用替换为直接引用的阶段。
符号引用(Symboilc Reference):以一组符号来描述引用目标,符号可以是任意形式的字面量。只能要准确定位到目标即可。符号引用与虚拟机的内存布局无关,引用的目标也不一定存在内存。这样兼容性强,各种虚拟机只需要能接受符号引用即可。
直接引用(Direct Reference):直接引用就是指向目标的指针、相对偏移量或者能间接定位到目标的 句柄,直接引用和虚拟机内存布局息息相关。直接引用的目标必然存在与内存中。
六、初始化:
主要工作:主要执行类构造器方法clinit。(class init的简称)
类初始化阶段是类加载的最后一个阶段。在初始化之前的过程中,用户可控的地方只有通过自定义类加载器参与,其余都是虚拟机主导和控制。
1、类构造方法:
类构造方法是由编译器自动收集源文件中的类变量赋值操作
和静态语句块
合并而成的。收集顺序是由语句在源文件的顺序所决定。故静态语句块只能访问定义之前的静态变量;对于定义之后的变量可以赋值,但不能访问。
clinit方法与类的实例构造方法init不同,clinit方法不需要显式调用父类构造器
,虚拟机会保证子类的clinit方法执行之前,父类的clinit方法已经执行完毕。故第一个被执行的clinit方法的类肯定是java.lang.Object;
clinit方法不是必需的
,对于没有静态块和类变量赋值操作,编译器不会生成clinit方法。
(1)父类静态语句和静态变量赋值优先于子类
.
(2)interface中不能有静态语句块
,但仍可以有变量初始化的赋值操作,也可以生成clinit方法。但接口和类的不同是,执行接口的clinit方法不需要先执行父接口的clinit方法。只有当父接口中定义的变量使用时,父接口才会初始化。
(3)虚拟机保证类构造方法可以多线程正确执行,会加锁、同步的操作。 一个线程执行类构造方法,其他线程阻塞等待
,当类构造方法有耗时操作,会造成多进程的阻塞,往往比较隐蔽。
2、类初始化时机:
(1)遇到new 、getstatic、putstatic或invokeStatic这4条字节指令时。常见场景:
a、遇到使用new关键字实例化对象时,触发new;
b、读取类变量时,触发getstatic;(final常量除外);
c、设置类变量时,触发putstatic;
d、调用类的静态方法时,触发invokeStatic;
(2)虚拟机启动时,需指定一个要执行的主类(含有main()
的类),虚拟机会先初始化该类;
(3)初始化一个类时,当其父类没有初始化,则需要先触发其父类的初始化;
(4)使用java.lang.reflect
包中的方法对类进行反射调用时;
(5)当java.lang.invoke.MethodHandle
实例最后的解析结果为REF_getStatic
、REF_putStatic
、REF_invokeStatic
的方法句柄,并且该句柄所对应的类没有进行过初始化;
对于final常量不能触发类初始化,是由于在编译时已把数据放入常量池的静态字段,当读取类的static final
字段时,并不需要初始化类,而是从常量池中去获取相应的数据。上述的5种场景的行为都是对类的一个主动引用过程。除此之外,还有被动引用并不会触发类的初始化过程。