1、方法调用并不等同于方法执行,方法调用阶段唯一的任务就是确定被调用方法的版本(即调用哪一个方法),暂时还不涉及方法内部的具体运行过程。在程序运行时,进行方法调用是最普遍、最频繁的操作,Class文件编译过程中不包含传统编译中的连接步骤,一切方法调用在Class文件里面存储的都只是符号引用,而不是方法在实际运行时内存布局中的入口地址(相当于之前的直接引用)。
2、解析。所有方法调用中的目标方法在Class文件里面都是一个常量池中的符号引用,在类加载的解析阶段,会将一部分符号引用转化为直接引用,这种解析能成立的前提是:方法在程序真正运行之前就有一个可确定的调用版本,并且这个方法的调用版本在运行期是不可改变的。换句话说,调用目标在程序代码写好、编译器进行编译时就必须确定下来。这类方法的调用称为解析。
2.1、在Java语言中符合编译器可知,运行期不可变这个要求的方法,主要包括静态方法和私有方法两大类,前者与类型直接关联,后者在外部不可被访问,这两种方法各自的特点决定了它们都不可能通过继承或别的方式重写其它版本,因此它们都适合在类加载阶段进行解析。与之对应的是,Java虚拟机里提供了5条方法调用指令,分别如下:
invokestatic:调用静态方法。
invokespecial:调用实例构造器init方法、私有方法和父类方法。
invokevirtual:调用所有的虚方法。
invokeinterface:调用接口方法,会在运行时再确定一个实现此接口的对象。
invokedynamic:先在运行时动态动态解析出调用点限定符所引用的方法,然后再执行该方法,在此之前的4条调用指令,分派逻辑是固化在Java虚拟机内部的,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的。
2.2、只能被invokestatic和invokespecial指令调用的方法,都可以在解析阶段中确定唯一的调用版本,符合这个条件的有静态方法、私有方法、实例构造器、父类方法4类,它们在类加载的时候就会把符号引用解析为该方法的直接引用。这些方法可以称之为非虚方法,与之相反,其它的方法称为虚方法(除去final方法)。
2.3、Java中的非虚方法除了使用invokestatic、invokespecial调用的方法之外还有一种,就是被final修饰的方法。虽然final方法是使用invokevirtual指令来调用的,但是由于它无法被覆盖,没有其它版本,所以也无须对方法接收者进行多态选择,又或者说多态选择的结果肯定是唯一的。在Java语言规范中明确说明了final方法是一种非虚方法。
2.4、解析调用一定是个静态的过程,在编译期间就完全确定,在类装载的解析阶段就会把涉及的符号引用全部转变为可确定的直接引用,不会延迟到运行期间再去完成。而分派调用则可能是静态的也可能是动态的,根据分派依据的宗量数可分为单分派和多分派。这两类方式的两两组合就构成了静态单分派、静态多分派、动态单分派、动态多分派4种分派组合。
3、分派。分派调用过程将会揭示多态性特征的一些最基本的体现,如重载和重写在Java虚拟机中是如何实现的,这里的实现不是语法上该如何写,而是虚拟机如何确定正确的目标方法。
3.1、静态分派。我们先按如下代码定义两个重要概念:
Man 继承自Human
Human man = new Man();
我们把上面代码中的Human称为变量的静态类型(Static Type),或者叫做变量的外观类型(Apparent Type),后面的Man则称为变量的实际类型(Actual Type),静态类型和实际类型在程序中都可以发生一些变化,区别是静态类型的变化仅仅在使用时发生,变量本身的静态类型不会被改变,并且最终的静态类型是在编译期可知的,而实际类型的变化结果在运行期才可确定,编译器在编译程序的时候并不知道一个对象的实际类型是什么。
3.2、虚拟机使用哪个重载版本,就完全取决于传入参数的数量和数据类型。虚拟机(准确地说是编译器)在重载时是通过参数的静态类型而不是实际类型作为判定依据。因此,在编译阶段,Javac编译器会根据参数的静态类型决定使用哪个重载版本。所有依赖静态类型来定位方法执行版本的分派动作称为静态分派。静态分派的典型应用是方法重载。静态分派发生在编译阶段,因此确定静态分派的动作实际上不是由虚拟机来执行的。
3.3、另外,编译器虽然能确定出方法的重载版本,但在很多情况下这个重载版本并不是唯一的,往往只能确定一个更加合适的版本,主要原因是字面量不需要定义,所以字面量没有显式的静态类型,它的静态类型只能通过语言上的规则去理解和推断。
3.4、静态方法会在类加载期就进行解析,而静态方法显然也是可以拥有重载版本的,选择重载版本的过程也是通过静态分派完成的。
4、动态分派。动态分派和多态的另一个特性重写有着很密切的关联。
显然这里不可能再根据静态类型来决定,因为静态类型同样都是Human的两个变量man和woman在调用sayHello()方法时执行了不同的行为,并且变量man在两次调用中执行了不同的方法。导致这个现象的原因就是因为这两个变量的实际类型不同。
javap输出这段代码的字节码指令:
4.1、虚拟机是如何根据实际类型来分派方法的执行版本呢?原因得从invokevirtual指令的多态查找过程说起,invokevirtual指令的运行时解析过程大致为:
1)找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。
2)如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回java.lang.IllegalAccessError异常。
3)否则,按照继承关系从下往上依次对C的各个父类进行第二步的搜索和验证过程。
4)如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。
4.2、由于invokevirtual指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的invokevirtual指令把常量池中的类方法符号引用解析到了不同的直接引用上,这个过程就是Java语言中方法重写的本质。我们把这种在运行期根据实际类型确定方法执行版本的分派过程称为动态分派。
5、单分派和多分派。方法的接收者和方法的参数统称为方法的宗量。根据分派基于多少宗量,可以将分派划分为单分派和多分派。单分派是根据一个宗量对目标方法进行选择,多分派则是根据多于一个宗量对目标方法进行选择。
5.1、静态分派属于多分派,因为编译阶段编译器的选择过程就是静态分派过程,这时选择目标方法的依据一是确定是哪个静态类型,二是确定是哪些个方法参数。因为是根据多个宗量,所以静态分派属于多分派。
5.2、动态分派属于单分派,运行阶段虚拟机的选择就是动态分派的过程。在执行invokevirtual指令时,由于编译期已经决定目标方法的签名,虚拟机此时不关心传递过来的方法参数,因为这时参数的静态类型、实际类型都对方法的选择不会构成任何影响,唯一可以影响的虚拟机选择的因素只有此方法的接收者的实际类型。因为只有一个宗量作为选择依据,所以动态分派属于单分派。
6、虚拟机动态分派的实现。前面介绍的分派过程作为对虚拟机概念模型的解析基本上已经足够了,它已经解决了虚拟机在分派中“会做什么”这个问题。但是虚拟机“具体是如何做到的”,可能各种虚拟机实现都会有些差别。
6.1、由于动态分派是非常频繁的动作,而且动态分派的方法版本选择过程需要运行时在类的方法元数据中搜索合适的目标方法,因此虚拟机的实际实现中基于性能的考虑,大部分都不会真正的进行如此频繁的搜索。面对这种情况,最常用的“稳定优化”手段就是为类在方法区中建立一个虚方法表(Vritual Method Table,也成为vtable,与此对应的,在invokeinterface执行时也会用到接口方法表—Interface Method Table,简称itable),使用虚方法表索引来代替元数据查找以提高性能。
6.2、虚方法表中存放着各个方法的实际入口。如果某个方法在子类中没有被重写,那子类的虚方法表里面的地址入口和父类相同方法的地址入口是一致的,都指向父类的实现入口。如果子类重写了这个方法,子类方法表中的地址将会替换为指向子类实现版本的入口地址。如上图,Son重写了来自Father的全部方法,因此Son的方法表没有指向Father类型数据的箭头。但是Son和Father都没有重写来自Object的方法,所以它们的方法表中所有从Object继承来的方法都指向了Object的数据类型。
6.3、为了程序实现上的方便,具有相同签名的方法,在父类、子类的虚方法表中都应当具有一样的索引序号,这样当类型变换时,仅需要变更查找的方法表,就可以从不同的虚方法表中按索引转换出所需的入口地址。
6.4、方法表一般在类加载的连接阶段进行初始化,准备了类的变量初始值后,虚拟机会把该类的方法表也初始化完毕。
6.5、上述的方法表是分派调用的“稳定优化”手段,虚拟机除了使用方法表之外还会,在条件允许的情况下,还会使用内联缓存(Inline Cache)和基于类型继承关系分析(Class Hierarchy Analysis,CHA)技术的守护内联(Guarded Inlining)两种非稳定的“激进优化”手段来获得更高的性能。
7、动态语言的支持。JDK1.7中新增的支持动态语言类型的字节码指令集—invokedynamic指令。动态类型语言的关键特征是它的类型检查的主体过程是在运行期而不是编译期。相对的,在编译期就进行类型检查过程的语言就是最常用的静态类型语言。
7.1、java.lang.invoke包。这个包的主要目的是在之前单纯依靠符号引用来确定调用的目标方法这种方式以外,提供一种新的动态确定目标方法的机制,成为MethodHandle。
实际上,方法getPrintlnMH()中模拟了invokevirtual指令的执行过程,只不过它的分派逻辑并非固化在Class文件的字节码上,而是通过一个具体的方法来实现的。而这个方法本身的返回值(MethodHandle对象),可以视为对最终方法调用的一个引用。
7.1.1、MethodHandle的使用效果与Reflection有众多相似之处,但是还是有如下区别:
1)从本质上来讲,Reflection和MethodHandle机制都是在模拟方法调用,但Reflection是在模拟Java代码层次的方法调用,而MethodHandle是在模拟字节码层次的方法调用。在MethodHandles.lookup中的3个方法—findStatic()、findVirtual()、findSpecial()正是为了对应于invokestatic、invokevirtual&invokeinterface和invokespecial这几条字节码指令的执行权限校验行为,这些底层细节在使用Reflection API时是不需要关心的。
2)Reflection中的java.lang.invoke.Method对象远比MethodHandle机制中的java.lang.invoke.MethodHandle对象所包含的信息多。前者是Java一端的全面映像,包含了方法的签名、描述符以及方法属性表中各种属性的Java端表示方式,还包含执行权限等的运行期信息。而后者仅仅包含与执行方法相关的信息。Reflection是重量级的,而MethodHandle是轻量级的。
3)由于MethodHandle是对字节码的方法指令调用的模拟,所以理论上虚拟机在这方面做的各种优化(如方法内联),在MethodHandle上也应当可以采用类似思路去支持。而通过反射调用方法则不行。
7.2、invokedynamic指令。在某种程度上来说,invokedynamic指令与MethodHandle机制作用一样,都是为了解决原有的4条“invoke*”指令方法分派规则固化在虚拟机之中的问题,把如何查找目标方法的决定权从虚拟机转嫁到具体用户代码之中,让用户有更高的自由度。它们两者的思路也可类比,可以把他们想象成为了达成同一个目的,一个采用上层Java代码和API来实现,另一个用字节码和Class中其他属性、常量来完成。
7.2.1、每一处含有invokedynamic指令的位置都称为“动态调用点”,这条指令的第一个参数不再是代表方法符号引用的CONSTANT_Methodref_info常量,而是变为CONSTANT_InvokeDynamic_info常量,从这个常量中可以得到3项信息:引导方法(Bootstrap Method,此方法存放在新增的BootstrapMethods属性中)、方法类型(MethodType)和名称。引导方法有固定的参数,并且返回值是java.lang.invoke.CallSite对象,这个代表真正要执行的目标方法调用。根据CONSTANT_InvokeDynamic_info常量中提供的信息,虚拟机可以找到并且执行引导方法,从而获得一个CallSite对象,最终调用要执行的目标方法。
8、基于栈的字节码解释执行引擎。
8.1、解释执行。Java语言中,Javac编译器完成了程序代码经过词法分析、语法分析到抽象语法树,再遍历语法树生成线性的字节码指令流的过程。因为这一部分是在Java虚拟机之外进行的,而解释器在虚拟机的内部,所以Java程序的编译就是半独立实现的。
8.2、基于栈的指令集与基于寄存器的指令集。Java编译器输出的指令流,基本上是一种基于栈的指令集架构,指令流中的指令大部分都是零地址指令,它们依赖操作数栈进行工作。与之相对的另外一套常用指令集架构是基于寄存器的指令集,最典型的就是x86的二地址指令集,通俗一些就是现在我们主流的PC机中直接支持的指令集架构,这些指令依赖寄存器进行工作。
8.2.1、基于寄存器的指令集主要优点就是可移植,寄存器由硬件直接提供,程序直接依赖这些硬件寄存器则不可避免地要受到硬件的约束。
8.2.2、基于栈架构的指令集,用户程序不会直接使用这些寄存器,就可以由虚拟机实现来自行决定把一些访问最频繁的数据(程序计数器、栈顶缓存等)放到寄存器中以获取尽量号的性能,这样实现起来也更加简单。栈架构的指令集还有一些其它优点,如代码相对更加紧凑(字节码中每个字节就对应一条指令,而多地址指令集中还需要存放参数)、编译器实现更加简单(不需要考虑空间分配问题,所需空间都在栈上操作)等。
8.2.3、栈架构的指令集的主要缺点是执行速度相对来说会稍慢一些。所有主流物理机的指令集都是寄存器架构也从侧面印证了这一点。
8.2.4、栈实现在内存之中,频繁的栈访问也意味着频繁的内存访问,相对于处理器来说,内存始终是执行速度的瓶颈。尽管虚拟机可以采取栈顶缓存的手段,把最常用的操作映射到寄存器中避免直接内存访问,但这也只是优化而不是解决本质问题的方法。由于指令数量和内存访问的原因,所以导致了栈架构的指令集的执行速度会相对较慢。
9、基于栈的解释器之执行过程。具体可参照字节码指令集配合再出栈入栈操作查看即可。
读《深入理解Java虚拟机-JVM高级特性与最佳实践》所做的笔记。