虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验,转换解析和初始化,最终形成可以被虚拟机直接使用的java类型,这就是虚拟机的类加载机制。
java语言的类的加载,连接(验证,准备,解析)和初始化过程都是在运行期间完成的,这种方式会令类加载时增加一些性能开销,但是却会为Java应用程序提高高度的灵活性,Java里天生可以动态扩展的语言特性就是依赖运行期动态加载和动态连接这个特点实现的。
类加载生命周期:
类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载,验证,准备,解析,初始化,使用和卸载7个阶段,其中,验证,准备,解析合起来统称为连接。
加载,验证,准备,初始化,卸载这5个阶段的步骤顺序是确定的,不会更改,而解析在某些情况下可以在初始化之后再开始,这是为了支持java语言的运行期绑定(动态绑定或晚期绑定)。这些步骤只是按顺序开始,而不是按顺序完成后再运行下一个,这些阶段通常是互相交叉运行的,会在执行一个阶段时调用或激活下一个阶段。
下面有(有且只有)5种情况必须立即对类进行初始化:
1遇到new,getstatic,putstatic,invokestatic(后3个是操作静态属性和静态方法的指令)这4条字节码指令,如果没有类进行过初始化,要先触发其初始化。
2使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,需要先触发其初始化。
3当初始化一个类的时候,如果发现其父类还没有进行过初始化,需要先触发其父类的初始化。
例:public class FuClass{
static{
Sysyem.out.println("父类初始化")
}
}
public class ZiClass extends FuClass{
static{
Sysyem.out.println("子类类初始化")
}
}
public class Initialization{
public static void main(String[] args){
Sysyem.out.println(FuClass.value);
}
}
上述代码,只会输出“父类初始化”。因为对于静态字段,只有直接定义这个字段的类才会被初始化,因此通过其子类来引用父类中定义的静态字段,只会触发父类的初始化而不会触发子类的初始化。
4当虚拟机启动时,用户需要指定一个要执行的主类(包括main()方法的那个类),虚拟机会先初始化这个主类。
5当使用JDK1.7以以上的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果是REF_getStatic,REF_putStatic,REF_invokeStatic的方法句柄(MethodHandle),并且这个方法句柄所对应的类没有进行过初始化,则需要先触发其初始化。
除这5种方式之外,所有引用类的操作都不会触发初始化,称为被动引用。
接口的加载与类加载的过程稍有不同:接口也是有初始化过程的,与类相似,但是,类中的代码是由静态语句块“static{}”来输出初始化信息的,而接口中不能使用这种语句块,但是编译器会给接口生成一个“<clinit>()”类构造器,用于初始化接口中所定义的成员变量,但是他们更大的区别在于当一个类在初始化时,要求其父类全被偶都已经被初始化过了,但是一个接口在初始化时,并不需要其父接口全部都完成了初始化,只有在真正使用到了父接口的时候才会初始化。
类加载过程:
加载:
加载是类加载的一个阶段,在加载阶段虚拟机需要完成以下3件事:
1通过一个类的全限定名来获取定义此类的二进制字节流。
2将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
3在内存中生成一个代表这个类的jva.lang.Class对象,作为方法区这个类的各种数据的访问入口。
验证:
验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全,验证阶段大约会完成4个阶段的检验动作:文字格式验证,元数据验证,字节码验证,符号引用验证。
准备:
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存豆浆在方法区中进行分配,这时候进行内存分配的仅包括类变量(被static修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在java堆中。而这里所说的“初始值”通常情况下是数据类型的零值。,假设一个类变量的定义为:
public static int value =111;
那变量value在准备阶段过后的初始值为0而不是111,因为这时候未执行任何java方法,而把value赋值为111的putstatic指令是程序被编译后,存放于类构造器<clinit>()方法中,所以把value赋值为111的动作是在初始化阶段才会执行。
而有通常情况就会有特殊情况,如果类字段的字段属性表中存在ConstantValue属性,则会被初始化为ContantValue指定的值:
public static final int value =111;
则在准备阶段就会将value设置为111.
解析:
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
符号引用:符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可,符号引用与虚拟机实现的内存布局无关,引用的目标并不一定以及加载到内存中,各种虚拟机实现的内存布局可以不相同,但是所接受的符号引用必须是一致的。
直接引用:直接引用可以是直接指向目标的指针,相对偏移量或是一个能间接定位到目标的句柄,直接引用和内存布局有关,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同,如果有了直接引用,那引用的目标必定以及在内存中存在。
解析分为4种:
1类或接口的解析
假设当前代码所处的类为D,如果要把一个从未解析过的符号引用N解析为一个类或接口C的直接引用,虚拟机完成解析一般分为3个步骤:
(1)如果C不是一个数组类型,那虚拟机将会把代表N的全限定名传递给类加载器去加载这个类C,在加载过程中,由于元数据验证,字节码验证的需要,可能触发其他相关类的加载操作,例如加载这个类的父类或实现的接口。一旦这个加载过程出现了任何异常,解析都失败
(2)如果C是一个数组类型,并且数组的元素是对象,也就是N的描述符号会是类型lang/Integer的形式,将会按照(1)中规则加载,如果如前面假设的,加载的类型就是java.Lang.Integer,接着又虚拟机生成一个代表数组维度和元素的数组对象。
(3)如果上面的步骤没有出现任何异常,那么C在虚拟机中已经是一个有效的类或接口了,但在解析之前还要进行符号验证,确认D是否具备对C的访问权限,如果不具备,将抛出异常。
2字段解析
要解析一个未被解析过的字段符号引用,首先将会对字段表内class_index项中索引的CONTSTANT_Class_info符号进行解析,也就是字段所属的类或接口的符号引用,在这个过程中出现了任何异常,都会导致解析失败,如果成功,将这个字段所属的类或接口用C表示,虚拟机按如下步骤对C进行搜索:
(1)如果C本身就包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用,查找结束。
(2)否则,如果在C中实现了接口,将会按照继承关系从下往上递归搜索每个接口和它的父接口,如果接口中包含了简单字符和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用,查找结束
(3)否则,如果C不是java.lang.Object的话,将会按照继承关系从下往上递归搜索其父类,如果在父类中包含了简单名称和字段描述都与目标相匹配的字段,则返回这个字段的直接引用,结束查找
(4)否则,查找失败,抛出异常。
3类方法解析
类方法解析的第一个步骤与字段解析一样,首先将会对字段表内class_index项中索引的CONTSTANT_Class_info符号进行解析,后续的类方法搜索为:
(1)类方法和接口方法符号引用的常量类型定义是分开的,如果在类方法表中发现class_index中索引的c是个接口,那就直接抛出异常
(2)如果通过了第一步,在类C中查找是否有简单字符和字段描述符都与目标相匹配的方法,如果有则返回这个字段的直接引用,查找结束。
(3)否则,在类C的父类中查找是否有简单字符和字段描述符都与目标相匹配的方法,如果有则返回这个字段的直接引用,查找结束。
(4)否则,在类C实现的接口列表及他们的父接口中递归查找是否有简单字符和字段描述符都与目标相匹配的方法,如果存在,证明C是一个抽象类,查找结束,抛出异常。
(5)否则,查找失败,抛出异常
4接口方法解析
接口方法也需要解析出接口方法表的class_index项中的索引的方法所属的类或接口的符号引用,如果解析成功,依然用C表示这个接口,后续的类方法搜索为:
(1)与类方法解析不同,如果在接口方法表中发现class_index中的索引C是个类而不是接口,直接抛出异常
(2)否则,在接口C中查找是否有简单字符和字段描述符都与目标相匹配的方法,如果有则返回这个字段的直接引用,查找结束。
(3)否则,在接口C的父接口中递归查找,直到java.lang.Object类为止,看是否有简单名称和字段描述都与目标相匹配的方法,则返回这个字段的直接引用,结束查找
(4)否则,查找失败,抛出异常
初始化:
类初始化是类加载的最后一步,前面类加载过程中,除了在加载阶段用户应用程序可以通过自定义类加载器参与之外,其余动作完全由虚拟机主导和控制,到了初始化阶段,才是真正开始执行类中定义的java程序代码(或者说是字节码)。
初始化阶段就是执行类构造器<clinit>()的过程
1<clinit>()方法是由编译期自动收集类中的所有变量的赋值动作和静态语句块(static{})中的语句合并的,编译器收集的顺序是由语句在源文件中出现的顺序决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在之后的变量,可以赋值,但不能访问。
例:
public class Test{
static{
i=0; //给变量赋值可以编译通过
System.out.printin(i); //编译器会提示报错
}
static int i=1;
}
2<clinit>()方法与实例构造器<init>()方法不同,不需要显示的调用父类构造器,虚拟机会保证在在子类的<clinit>()方法执行前。父类的<clinit>()方法已经执行。
3由于父类的<clinit>()先执行,也意味着父类的静态语句块要优先于子类的变量赋值操作
4<clinit>()对于类或接口不是必须的,如果类没有静态语句块,也没有对变量进行赋值操作,那么编译器不为这个类生产<clinit>()方法。
5接口与类都会生成<clinit>()方法,但一个类在初始化时,要求其父类全被偶都已经被初始化过了,而一个接口在初始化时,并不需要其父接口全部都完成了初始化,只有在真正使用到了父接口的时候才会初始化。
6虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确的加锁,同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类<clinit>()方法,其他线程都需要阻塞等待,知道活动线程的<clinit>()方法完毕。如果一个类中<clinit>()方法有耗时很长的操作,就可能造成多个线程阻塞。