一.魔数与版本号
每个Class文件的头4个字节被称为魔数,它的唯一作用是确定这个文件是否为一个能被虚拟机接受的class文件。有许多文件都通过魔数的方式来对文件进行验证。Java class文件的魔数位0xCAFEBABE,寓意咖啡宝贝。
紧随着魔数的四个字节存储的class文件的版本号,这个不用过多去关注。
二.常量池
常量池是class文件的一部分,常量池的入口紧接着主、次版本号。由于常量池中常量数量不固定,所以常量池的入口需要放置一项u2类型的数据(u2代表占两个字节的无符号数),代表常量池容量计数值,需要指明的是这个容量计数是从1开始的,如下图所示,容量为0x0016,即十进制的22,这就代表常量池有21项常量,索引值范围为1~21。特地把0号索引留出来是为了表达“不引用常量池任何一个项目”的含义。class文件结构只有常量池的容量计数是从1开始的。

常量池主要存放两大类常量:字母量和符号引用,字面量比较接近Java语言层面的常量概念,如文本字符串,被声明为final的常量值等,而符号引用属于编译原理方面的概念,主要包括下面几类常量:
*被模块导出或开放的包
*类和接口的全限定名
*字段的名称和描述符
*方法的名称和描述符
*方法句柄和方法类型
*动态调用点和动态常量
Java代码在进行Javac编译的时候,不会像c++那样有“连接”这一步骤,而是会在虚拟机加载class文件的时候进行动态链接(验证,准备,解析),也就是说class文件中不会保存各个方法、字段最终在内存中的布局信息,这些字段、方法的符号引用不经过虚拟机在运行期转换(解析)的话是无法得到真正的内存入口地址,也就无法被虚拟机使用。当虚拟机做类加载时,将会从常量池获得对应的符号引用,再在类创建时或运行时解析、翻译到具体的内存地址之中。
常量池的每一项常量都是一个表(即后缀带有“info”的),如下所示:

拿CONSTANT_Class_info表来举例,

tag是标志位,它用于区分常量类型,name_index是常量池的索引值,它指向了CONSTANT_Utf8_info类型常量,此常量代表了这个类(或接口)的全限定名,然后我们再来看看CONSTANT_Utf8_info的结构

tag是标志位,用于区分常量类型,length代表这个UTF-8编码的字符串长度是多少字节,它后面紧跟着的长度为length字节的连 续数据是一个使用UTF-8缩略编码表示的字符串。顺便提一下,由于Class文件中方法、字段等都需要引用CONSTANT_Utf8_info型常量来描述名 称,所以CONSTANT_Utf8_info型常量的最大长度也就是Java中方法、字段名的最大长度,这个例子中bytes存储的是我们类的全限定名。
三.访问标志
在常量池结束后,紧随着2个字节代表访问标志(access_flags),这个标志用于识别一下类或接口层次的访问信息,包括:这个class是类还是接口;是否定义为public;是否为abstact;如果是类的话,是否被声明为final等等,详细情况如下表

四.类索引、父类索引与接口索引集合
类索引和父类索引都是一个u2类型的数据,而接口索引集合是一组u2类型的数据的集合,class文件中由这三项数据来确定该类型的继承关系。类索引、父类索引、接口索引都按顺序排列在访问标志之后,类索引和父类索引用两个分别用一个u2类型的缩影值表示,它们各自指向一个为CONSTANT_Class_info的类描述符常量量,通过 CONSTANT_Class_info类型的常量中的索引值可以找到定义在CONSTANT_Utf8_info类型的常量中的 全限定名字符串,如下图所示

对于接口索引集合,入口的第一项u2类型的数据为接口计数器,表示索引表的容量,其后的如果u2类型数据的索引过程和上图类似。
五.字段表集合
字段表(Feld_info)用于描述接口或类中声明的变量。Java语言中的“字段”(Field)包括类级(static)变量以及实例级变量,但不包括在方法内部声明的局部变量,对于一个字段,我们可能需要有各种各样的修饰符来修饰它,所以对于字段表来说,我们需要在其表结构中添加access_flags(即字段访问标志,注意,和类访问标志不同),跟随access_flags标志的是两项索引值:name_index和descriptor_index。它们都是对常量池项的引 用,分别代表着字段的简单名称以及字段和方法的描述符。

全限定名:如org/fenixsoft/clazz/TestClass
简单名称:没有类型和参数修饰的方法或字段名称
方法和字段的描述符:描述字段的数据类型、方法的参数列表和返回值,如下所示

举例:方法int indexOf(char[]source,int sourceOffset,int sourceCount,char[]target, int targetOffset,int targetCount,int fromIndex)的描述符为“([CII[CIII)I”。
attribute_info为属性表集合,class文件,字段表,方法表都可以携带自己的属性表集合。详细情况如下:

属性表结构:

对于每一个属性,它的名称都要从常量池中引用一个CONSTANT_Utf8_info类型的常量来表示, 而属性值的结构则是完全自定义的,只需要通过一个u4的长度属性去说明属性值所占用的位数即可。
本文深入剖析Java Class文件的结构,包括魔数确认文件类型、版本号标识兼容性、常量池存储字面量和符号引用、访问标志记录类属性、类索引描述继承关系、字段表集合列举变量信息。理解Class文件结构对于Java开发者至关重要。
954

被折叠的 条评论
为什么被折叠?



