教程:https://www.bilibili.com/video/BV1sJ411m7gP?p=1
文档:https://blog.youkuaiyun.com/qq_40574305/article/details/104858888
class文件-常量池类型汇总:https://blog.youkuaiyun.com/lioncatch/article/details/105957696
前言
为什么要分析class文件?——可以解决一些在开发过程中难以想象问题,比如为什么我们在实例方法中可以使用this?我们执行java jvm指令时,一旦指令报错,为什么可以反馈到具体是哪一行源代码报错?new对应的指令里为什么有个dup?也可以为学ASM(?)打下基础。
准备工作
-
如何查看.class文件:因为直接打开.class文件是乱码,所以需要下载EditPlus,然后以16进制形式查看,如下图所示。
-
查看javap反编译后的文件:
在命令行输入以下命令(路径自己配)
javap -verbose E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by.txt
/*下面两个可选,都是从-verbose分化出来的*/
javap -c E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by_c.txt
javap -l E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by_l.txt
- JVM字节码内容结构
逐字节分析
-
魔数
文件开头有个固定值CAFEBABE,也就是魔数
-
次版本号,主版本号
次版本号为0000,也就是0
主版本号为0032,也就是50,对应jdk1.6
因此对应的jdk版本号为1.6.0 -
常量池的个数
计算得:
13 + 7*16 = 125
由于第0号常量池被我们的JVM占用了,表示的是什么都不引用,所以要减1:
125 - 1 = 124
对应到javap命令得到的结果,常量池确实是从1开始编号的,并且一共有124个:
-
常量池内容
需要查表,可参考博客:https://blog.youkuaiyun.com/lioncatch/article/details/105957696
例如查看第一个常量,接下来读到的第一个字节是01:
查下表,得知01代表1号常量类型CONSTANT_Utf8_info:
查看CONSTANT_Utf8_info类型数据结构:
第一个字节是tag,也就是01,表示CONSTANT_Utf8_info,第二个字节是长度,002F,换算成十进制就是47:
长度为多少,就需要往后数多少个字节,因此往后数47个字节:
借助工具查看内容(地址:http://www.ab126.com/goju/1711.html),或者直接看编辑器右边的内容:
在javap所得文件里查看第一个常量,结果分析正确:
再来看第二个常量:
07,代表CONSTANT_Class_info:
tag后面是两个字节的name_index,指向1:
查看javap反编译结果:
对应到源代码文件,得知ApacheEngineConfig是个类名:
以同样的方法分析得到followRedirects:
接下来几个都是Utf8类型的,这里就略过了,直接来看第9个常量:
第10个常量:
。。。
一直到最后一个常量:
5.5. 细节
注意到常量池中有个Code:
Code对应的是下面这块区域,里面存放的是JVM指令:
为了方便以后引用,所以要将Code放入常量池中。此外,常量池中还有一个LineNumberTable:
LineNumberTable,即行号表,前文所提的问题:我们执行java jvm指令时,一旦指令报错,为什么可以反馈到具体是哪一行源代码报错?就是因为LineNumberTable里面保存了JVM指令和源码的映射关系:
如上图所示,如果0这个JVM指令报错了,那么就可以知道对应的是源码第20行报错。
还有局部变量表,他可以解决这个问题:为什么我们在实例方法中可以使用this?
注意下面这个方法,它没有入参,那为什么它的locals=1呢?就是因为它隐式地把this作为第一个参数传了进去,所以我们可以在写代码的时候使用this。
那这些是什么意思呢?
通常来说,下面的Z,()Z是用来描述上面的东西是什么类型的,比如followRedirects是Z类型的,getFollowRedirects是个函数,没有入参,返回值是Z。
- access_flag 类的权限描述符(2个字节)
同样的,查看查询手册:
直接查是查不到的,因为0031是这3个权限加起来的结果:
可以查看javap反编译文件进行验证: - this class name 索引值(2个字节)
指向常量值第二个位置:
- super class 索引值(2个字节)
- 接口数(2个字节)
由于接口数占2个字节,因此最大的接口数是FFFF,即65535 - 字段个数(2个字节)
有7个字段(变量),可以通过查找源码中var的个数验证:
- field_info
有7个字段,所以有7个field_info
0002---->acc_private(查表) #?查表不对
0005---->followRedirects(常量池中查找)
0006---->Z(常量池中查找)
0000---->0
以此类推,再数6个:
上面这个有一个attribute,attribute结构如下:
12.method_count
15个方法,也是按照上面的思路,查表,就可以翻译出来,每个方法的结构如下:
就不一一翻译了。
12.5. JVM指令助记符
这部分是Code当中最重要的部分,但这些不是JVM指令,而是JVM指令助记符,底层只认识二进制:
尾声
a.JVM为什么要这么设计:先把常量池都填满了,后面要用的时候再通过索引来引用,保证在JVM底层能够识别的情况下,把文件压缩地越小越好
b.new对应的指令里为什么有一个dup?