第六章 类文件的结构
一.Class类文件的结构
- Class文件是一组以8字节为基础单元的二进制流,各个数据项目严格按照顺序紧凑的排列在Class文件中,中间没有添加任何分隔符,整个Class文件中存储的内容几乎都是程序运行的必要数据,没有空隙存在。
- 遇到8位字节以上的空间的数据项时,会按照高位在前的方式分割成若干个8位字节进行存储。
- Class文件中有两种数据类型,分别是无符号数和表。
二.Class文件结构
1. 魔数
- 每个Class文件的头4个字节称为魔数(Magic Number)
- 作用:确定这个文件是否为一个能被虚拟机接受的Class文件。0xCAFEBABE
- 紧接着魔数的4个字节存储的是Class文件的版本号:第5、6字节是此版本号,第7、8字节是主版本号。
2.常量池
- 常量池入口放置一项u2类型数据,代表常量池容量计数值。容量计数从1开始。比如0x0016代表常量池中有21项常量。
- 常量池中每一项常量都是一个表。14种表有一个共同特点,就是表开始的第一位是一个u1类型的标志位(tag),用于区分常量类型。
- 查看常量池表读取常量,指令:javap。
3.访问标识
- 常量池结束后,紧接着两个字节代表访问标志,用于识别一些类或者接口层次的访问信息,包括:这个Class是类还是接口;是否定义为public类型;是否定义为abstract类型;如果是类的话是否被定义为final等。
- access_flags中一共有16个标志位可用,目前定义了8个;
- access_flags的值为标志位取或运算。比如0x0021是0x0001和0x0020取或,所以0x0021表示ACC_PUBLIC和ACC_SUPER为真。
4.类索引、父类索引与接口索引集合
- 类索引(this_class)和父类索(super_class)引都是一个u2类型的数据,接口索引集合(interfaces)是一组u2类型的数据集合(因为Java不允许多重继承,但是允许实现多个接口)。它们按顺序排列在访问标志之后。
5.字段表集合
- 字段表(field_info)集合用于描述接口或者类中声明的变量。不包括方法内部声明的局部变量。
6.方法表集合
- 与对字段的描述类似。
- 方法里的代码存放在方法属性表集合中名为“Code”的属性中。
7.属性表集合
- 在Class文件、字段表、方法表都可以携带属性表集合,以用于描述某些场景专有的信息。
三、字节码指令
- Java虚拟机的指令由一个字节长度的操作码以及操作数构成。
- 由于限制了Java虚拟机操作码的长度为一个字节(0~255),意味着指令集的操作码总数不可能超过256条。
- 基于栈的指令集架构。
1.字节码与数据类型
- 大多数的指令都包含了其操作所对应的数据类型信息。
- 数据类型多,指令少。指令集非完全独立(即非每种数据类型和每一种操作都有对应指令)。
2.加载和存储指令
- 用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。
3.运算指令
4.类型转换指令
- 宽化类型转换:小范围类型向大范围类型的安全转换。
- 处理窄化类型转换时,必须显式地使用转换指令来完成,这些指令包括:i2b、i2c、i2s…
5.对象创建与访问指令
6.操作数栈管理指令
7.控制转移指令
8.方法调用和返回指令
9.异常处理指令
- 在Java虚拟机中,处理异常(catch语句)不是由字节码指令来实现的,而是采用异常表来完成的。