教程:https://www.bilibili.com/video/BV1sJ411m7gP?p=1
文档:https://blog.youkuaiyun.com/qq_40574305/article/details/104858888
class文件-常量池类型汇总:https://blog.youkuaiyun.com/lioncatch/article/details/105957696
前言
为什么要分析class文件?——可以解决一些在开发过程中难以想象问题,比如为什么我们在实例方法中可以使用this?我们执行java jvm指令时,一旦指令报错,为什么可以反馈到具体是哪一行源代码报错?new对应的指令里为什么有个dup?也可以为学ASM(?)打下基础。
准备工作
-
如何查看.class文件:因为直接打开.class文件是乱码,所以需要下载EditPlus,然后以16进制形式查看,如下图所示。

-
查看javap反编译后的文件:
在命令行输入以下命令(路径自己配)
javap -verbose E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by.txt
/*下面两个可选,都是从-verbose分化出来的*/
javap -c E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by_c.txt
javap -l E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by_l.txt
- JVM字节码内容结构

逐字节分析
-
魔数
文件开头有个固定值CAFEBABE,也就是魔数

-
次版本号,主版本号
次版本号为0000,也就是0

主版本号为0032,也就是50,对应jdk1.6

因此对应的jdk版本号为1.6.0 -
常量池的个数

计算得:
13 + 7*16 = 125
由于第0号常量池被我们的JVM占用了,表示的是什么都不引用,所以要减1:
125 - 1 = 124
对应到javap命令得到的结果,常量池确实是从1开始编号的,并且一共有124个:


-
常量池内容
需要查表,可参考博客:https://blog.youkuaiyun.com/lioncatch/article/details/105957696
例如查看第一个常量,接下来读到的第一个字节是01:

查下表,得知01代表1号常量类型CONSTANT_Utf8_info:

查看CONSTANT_Utf8_info类型数据结构:

第一个字节是tag,也就是01,表示CONSTANT_Utf8_info,第二个字节是长度,002F,换算成十进制就是47:

长度为多少,就需要往后数多少个字节,因此往后数47个字节:

借助工具查看内容(地址:http://www.ab126.com/goju/1711.html),或者直接看编辑器右边的内容:

在javap所得文件里查看第一个常量,结果分析正确:

再来看第二个常量:

07,代表CONSTANT_Class_info:

tag后面是两个字节的name_index,指向1:

查看javap反编译结果:

对应到源代码文件,得知ApacheEngineConfig是个类名:

以同样的方法分析得到followRedirects:

接下来几个都是Utf8类型的,这里就略过了,直接来看第9个常量:



第10个常量:



。。。
一直到最后一个常量:

5.5. 细节
注意到常量池中有个Code:

Code对应的是下面这块区域,里面存放的是JVM指令:

为了方便以后引用,所以要将Code放入常量池中。此外,常量池中还有一个LineNumberTable:

LineNumberTable,即行号表,前文所提的问题:我们执行java jvm指令时,一旦指令报错,为什么可以反馈到具体是哪一行源代码报错?就是因为LineNumberTable里面保存了JVM指令和源码的映射关系:

如上图所示,如果0这个JVM指令报错了,那么就可以知道对应的是源码第20行报错。
还有局部变量表,他可以解决这个问题:为什么我们在实例方法中可以使用this?

注意下面这个方法,它没有入参,那为什么它的locals=1呢?就是因为它隐式地把this作为第一个参数传了进去,所以我们可以在写代码的时候使用this。

那这些是什么意思呢?
通常来说,下面的Z,()Z是用来描述上面的东西是什么类型的,比如followRedirects是Z类型的,getFollowRedirects是个函数,没有入参,返回值是Z。
- access_flag 类的权限描述符(2个字节)

同样的,查看查询手册:

直接查是查不到的,因为0031是这3个权限加起来的结果:
可以查看javap反编译文件进行验证:
- this class name 索引值(2个字节)

指向常量值第二个位置:

- super class 索引值(2个字节)


- 接口数(2个字节)

由于接口数占2个字节,因此最大的接口数是FFFF,即65535 - 字段个数(2个字节)

有7个字段(变量),可以通过查找源码中var的个数验证:

- field_info
有7个字段,所以有7个field_info


0002---->acc_private(查表) #?查表不对
0005---->followRedirects(常量池中查找)
0006---->Z(常量池中查找)
0000---->0

以此类推,再数6个:




上面这个有一个attribute,attribute结构如下:




12.method_count

15个方法,也是按照上面的思路,查表,就可以翻译出来,每个方法的结构如下:
就不一一翻译了。
12.5. JVM指令助记符
这部分是Code当中最重要的部分,但这些不是JVM指令,而是JVM指令助记符,底层只认识二进制:

尾声
a.JVM为什么要这么设计:先把常量池都填满了,后面要用的时候再通过索引来引用,保证在JVM底层能够识别的情况下,把文件压缩地越小越好
b.new对应的指令里为什么有一个dup?

1303

被折叠的 条评论
为什么被折叠?



