Class类文件的结构
位:(bit):是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。
字节:(byte):是计算机中 数据处理 的基本单位,习惯上用大写 B 来表示,1B(byte,字节)= 8bit(位)。
字符:是指计算机中使用的字母、数字、字和符号,1字符 = 2字节。
Class文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在Class文件中,中间没有任何分隔符号;
Class文件结构中只有两种数据类型:无符号数和表;
无符号数属于基本的数据类型,以u1、u2、u4和u8分别代表1个字节、2个字节、4个字节和8个字节的无符号数;
表是由多个无符号数或其他表作为数据项构成的复合数据类型,所有表都以 “_info” 结尾。
-
魔数与Class文件的版本
每个Class文件的头4个字节称为魔数(magic),唯一作用是用于确定这个文件是否为一个能被虚拟机接受的Class文件(即身份识别)。
4个字节魔数后面存储的是Class问价的版本号:第5和第6字节是次版本号(minor_version),第7和第8字节是主版本号(major_version) -
常量池
主次版本号之后的是常量池入口;由于常量池中常量的数量是不固定的,所以需要先放置一项u2类型的数代表常量池容量计数值(constant_pool_count),计数从1开始其他集合类型都是从0开始;
常量池中主要存放两大类常量:字面量(如文本字符串、被声明为final的常量值等)和符号引用(类和接口的权限定名、字段的名称和描述符、方法的名称和描述符);
常量池中的每一项常量都是一个表,共有11中结构各不相同的表结构数据,11种表的共同特点是表开始的第一位是一个u1类型的标志位
-
访问标志
常量池结束之后紧接着的2个字节代表访问标志,用于识别类或接口层次的访问信息,包括:这个Class是类还是接口、是否定义为public类型、是否定义为abstract类型、如果是类的话是否被声明为final,等等。
标志名称 | 标志值 | 含义 |
---|---|---|
ACC_PUBLIC | 0x0001 | 是否为Public类型 |
ACC_FINAL | 0x0010 | 是否被声明为final,只有类可以设置 |
ACC_SUPER | 0x0020 | 是否允许使用invokespecial字节码指令的新语义. |
ACC_INTERFACE | 0x0200 | 标志这是一个接口 |
ACC_ABSTRACT | 0x0400 | 是否为abstract类型,对于接口或者抽象类来说,次标志值为真,其他类型为假 |
ACC_SYNTHETIC | 0x1000 | 标志这个类并非由用户代码产生 |
ACC_ANNOTATION | 0x2000 | 标志这是一个注解 |
ACC_ENUM | 0x4000 | 标志这是一个枚举 |
-
类索引、父类索引与接口索引集合
类索引(this_class)和父类索引(super_class)都是一个u2类型的数据,而接口索引集合(interfaces)是一组u2数据类型的集合; -
字段表集合
全限定名:如 cn/com/gnnt/test3/TestClass 即把类全名中的“.”替换为“/”
简单名称:没有类型和参数修饰的方法或字段名,如 sum()方法和 int i 的简单名称为“sum”和“i”
描述符:用来描述字段的数据类型、方法的参数类型(包括数量、类型及顺序)和返回值;描述方法时按先参数列表后返回值的顺序,如void add(int a,int b) 记录为 (II)V
如下表是描述符标识字符含义表
标识字符 | 含义 |
---|---|
B | byte |
C | char |
D | double |
F | float |
I | int |
J | long |
S | short |
Z | boolean |
V | void |
L | 对象类型,如Ljava/lang/Object |
[ | 数组类型,如 java.lang.String[][] 记录为[[Ljava/lang/String; int[] 记录为 [I |
字段表(field_info)用于描述接口或类中声明的变量,包含的信息有:字段作用域(public、protected、private)、是类级别变量还是实例级别变量(static修饰符)、可变性(final)、并发可见性(volatile修饰符,是否强制从主内存读写)、可否序列化(transient)、字段数据类型(基本类型、数组、对象)、字段名称。
①字段修饰符放在access_flags中
②name_index和descriptor_index都是对常量池的引用,分别代表字段的简单名称和字段的描述符;
③attributes 表示字段在属性表中存放的的额外信息,如“int a = 123”那就在属性表中存放一项名为ConstantValue的属性,其值指向常量123。
-
方法表集合
和字段表类似
①访问标志(access_flags)
②方法里的java代码,经过编译器编译成字节码指令之后,存放在方法属性表集合中一个名为“Code”的属性里面。 -
属性表集合
与Class文件中其他的数据项目要求严格的顺序、长度和内容不同,属性表集合的限制稍微宽松了一些,不再要求各个属性表具有严格顺序,并且只要不与已有属性名重复,任何人实现的编译器都可以向属性表具有严格顺序,并且只要不与已有属性名重复,任何人实现的编译器都可以向属性表中写入自己定义的属性信息,Java虚拟机运行时会忽略掉他不认识的属性。为了能正确解析Class文件,《java虚拟机规范》预定义21项虚拟机实现应当能识别的属性,具体内容见下表。下文中将对其中一些属性中的关键常用的部分进行讲解。
属性名称 | 使用位置 | 含义 |
---|---|---|
Code | 方法表 | Java代码编译成的字节码指令 |
ConstantValue | 字段表 | final关键字定义的常量值 |
Deprecated | 类、方法表、字段表 | 被声明为deprecated的方法和字段 |
Exceptions | 方法表 | 方法抛出的异常 |
EnclosingMethod | 类文件 | 仅当一个类为局部类或者匿名类时才能拥有这个属性,这个属性用于标识这个类所在的外围方法 |
InnerClasses | 类文件 | 内部类列表 |
LineNumberTable | Code属性 | Java源码的行号与字节码指令的对用关系 |
LocalVariableTable | Code属性 | 方法的局部变量描述 |
StackMapTable | Code属性 | JDK1.6中新增的属性,供新的类型检查验证器(Type Checker)检查和处理目标方法的局部变量和操作数栈所需要的类型是否匹配 |
Signature | 类、方法表、字段表 | JDK1.5中新增的属性,这个属性用于支持泛型情况下的方法签名,在Java语言中,任何类、接口、初始化方法或成员的泛型签名如果包含了类型变量(Type Variables)或参数化类型(Parameterized Types),则Signature属性会为他记录泛型签名信息。由于Java的泛型采用擦除法实现,在为了避免类型信息被擦出后导致签名混乱,需要这个属性记录泛型中的相关信息 |
SourceFile | 类文件 | 记录源文件名称 |
SourceDebugExtension | 类文件 | JDK 1.6中新增的属性,SourceDebugExtension属性用于存储额外的调试信息,譬如在进行JSP文件调试时,无法同构Java堆栈来定位到JSP文件的行号,JSR-45规范为这些非Java语言编写,却需要编译成字节码并运行在Java虚拟机中的程序提供了一个进行调试的标准机制,使用SourceDebugExtension属性就可以用于存储这个标准所新加入的调试信息 |
Synthetic | 类、方法表、字段表 | 标识方法或字段为编译器自动生成的 |
LocalVariableTypeTable | 类 | JDK 1.5中新增的属性,他使用特征签名代替描述符,是为了引入泛型语法之后能描述泛型参数化类型而添加 |
RuntimeVisibleAnnotations | 类、方法表、字段表 | JDK 1.5中新增的属性,为动态注解提供支持。RuntimeVisibleAnnotations属性用于指明哪些注解是运行时(实际上运行时就是进行反射调用)可见的 |
RuntimeInVisibleAnnotations | 类、方法表、字段表 | JDK 1.5新增的属性,与RuntimeVisibleAnnotations属性作用刚好相反,用于指明哪些注解是运行时不可见的 |
RuntimeVisibleParameter Annotations | 方法表 | JDK 1.5新增的属性,作用与RuntimeVisibleAnnotations属性类似,只不过作用对象为方法参数 |
RuntimeInVisibleAnnotations Annotations | 方法表 | JDK 1.5中新增的属性,作用与RuntimeInVisibleAnnotations属性类似,只不过作用对象为方法参数 |
AnnotationDefault | 方法表 | JDK 1.5中新增的属性,用于记录注解类元素的默认值 |
BootstrapMethods | 类文件 | JDK 1.7中新增的属性,用于保存invokedynamic指令引用的引导方法限定符 |