《深入理解Java虚拟机》学习总结-class文件

最新推荐文章于 2025-02-08 15:44:08 发布

原创最新推荐文章于 2025-02-08 15:44:08 发布 · 259 阅读

0 ·

CC 4.0 BY-SA版权

本文深入剖析Java Class文件的结构，包括魔数确认文件类型、版本号标识兼容性、常量池存储字面量和符号引用、访问标志记录类属性、类索引描述继承关系、字段表集合列举变量信息。理解Class文件结构对于Java开发者至关重要。

一.魔数与版本号

每个Class文件的头4个字节被称为魔数，它的唯一作用是确定这个文件是否为一个能被虚拟机接受的class文件。有许多文件都通过魔数的方式来对文件进行验证。Java class文件的魔数位0xCAFEBABE，寓意咖啡宝贝。

紧随着魔数的四个字节存储的class文件的版本号，这个不用过多去关注。

二.常量池

常量池是class文件的一部分，常量池的入口紧接着主、次版本号。由于常量池中常量数量不固定，所以常量池的入口需要放置一项u2类型的数据（u2代表占两个字节的无符号数），代表常量池容量计数值，需要指明的是这个容量计数是从1开始的，如下图所示，容量为0x0016，即十进制的22，这就代表常量池有21项常量，索引值范围为1~21。特地把0号索引留出来是为了表达“不引用常量池任何一个项目”的含义。class文件结构只有常量池的容量计数是从1开始的。

常量池主要存放两大类常量：字母量和符号引用，字面量比较接近Java语言层面的常量概念，如文本字符串，被声明为final的常量值等，而符号引用属于编译原理方面的概念，主要包括下面几类常量：

*被模块导出或开放的包

*类和接口的全限定名

*字段的名称和描述符

*方法的名称和描述符

*方法句柄和方法类型

*动态调用点和动态常量

Java代码在进行Javac编译的时候，不会像c++那样有“连接”这一步骤，而是会在虚拟机加载class文件的时候进行动态链接（验证，准备，解析），也就是说class文件中不会保存各个方法、字段最终在内存中的布局信息，这些字段、方法的符号引用不经过虚拟机在运行期转换（解析）的话是无法得到真正的内存入口地址，也就无法被虚拟机使用。当虚拟机做类加载时，将会从常量池获得对应的符号引用，再在类创建时或运行时解析、翻译到具体的内存地址之中。

常量池的每一项常量都是一个表（即后缀带有“info”的），如下所示：

拿CONSTANT_Class_info表来举例，

tag是标志位，它用于区分常量类型，name_index是常量池的索引值，它指向了CONSTANT_Utf8_info类型常量，此常量代表了这个类（或接口）的全限定名，然后我们再来看看CONSTANT_Utf8_info的结构

tag是标志位，用于区分常量类型，length代表这个UTF-8编码的字符串长度是多少字节，它后面紧跟着的长度为length字节的连续数据是一个使用UTF-8缩略编码表示的字符串。顺便提一下，由于Class文件中方法、字段等都需要引用CONSTANT_Utf8_info型常量来描述名称，所以CONSTANT_Utf8_info型常量的最大长度也就是Java中方法、字段名的最大长度，这个例子中bytes存储的是我们类的全限定名。

三.访问标志

在常量池结束后，紧随着2个字节代表访问标志（access_flags），这个标志用于识别一下类或接口层次的访问信息，包括：这个class是类还是接口；是否定义为public；是否为abstact；如果是类的话，是否被声明为final等等，详细情况如下表

四.类索引、父类索引与接口索引集合

类索引和父类索引都是一个u2类型的数据，而接口索引集合是一组u2类型的数据的集合，class文件中由这三项数据来确定该类型的继承关系。类索引、父类索引、接口索引都按顺序排列在访问标志之后，类索引和父类索引用两个分别用一个u2类型的缩影值表示，它们各自指向一个为CONSTANT_Class_info的类描述符常量量，通过 CONSTANT_Class_info类型的常量中的索引值可以找到定义在CONSTANT_Utf8_info类型的常量中的全限定名字符串，如下图所示

对于接口索引集合，入口的第一项u2类型的数据为接口计数器，表示索引表的容量，其后的如果u2类型数据的索引过程和上图类似。

五.字段表集合

字段表（Feld_info）用于描述接口或类中声明的变量。Java语言中的“字段”（Field）包括类级（static）变量以及实例级变量，但不包括在方法内部声明的局部变量，对于一个字段，我们可能需要有各种各样的修饰符来修饰它，所以对于字段表来说，我们需要在其表结构中添加access_flags(即字段访问标志，注意，和类访问标志不同），跟随access_flags标志的是两项索引值：name_index和descriptor_index。它们都是对常量池项的引用，分别代表着字段的简单名称以及字段和方法的描述符。