JVM字节码(.class文件)分析

教程:https://www.bilibili.com/video/BV1sJ411m7gP?p=1
文档:https://blog.youkuaiyun.com/qq_40574305/article/details/104858888
class文件-常量池类型汇总:https://blog.youkuaiyun.com/lioncatch/article/details/105957696


前言

为什么要分析class文件?——可以解决一些在开发过程中难以想象问题,比如为什么我们在实例方法中可以使用this?我们执行java jvm指令时,一旦指令报错,为什么可以反馈到具体是哪一行源代码报错?new对应的指令里为什么有个dup?也可以为学ASM(?)打下基础。


准备工作

  1. 如何查看.class文件:因为直接打开.class文件是乱码,所以需要下载EditPlus,然后以16进制形式查看,如下图所示。
    在这里插入图片描述

  2. 查看javap反编译后的文件:

在命令行输入以下命令(路径自己配)

javap -verbose E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by.txt

/*下面两个可选,都是从-verbose分化出来的*/
javap -c E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by_c.txt

javap -l E:/code/kotlin-byte/ApacheEngineConfig.class >E:/code/kotlin-do/by_l.txt
  1. JVM字节码内容结构
    在这里插入图片描述

逐字节分析

  1. 魔数
    文件开头有个固定值CAFEBABE,也就是魔数
    在这里插入图片描述

  2. 次版本号,主版本号
    次版本号为0000,也就是0
    在这里插入图片描述
    主版本号为0032,也就是50,对应jdk1.6
    在这里插入图片描述
    因此对应的jdk版本号为1.6.0

  3. 常量池的个数
    在这里插入图片描述
    计算得:
    13 + 7*16 = 125
    由于第0号常量池被我们的JVM占用了,表示的是什么都不引用,所以要减1:
    125 - 1 = 124
    对应到javap命令得到的结果,常量池确实是从1开始编号的,并且一共有124个:
    在这里插入图片描述
    在这里插入图片描述

  4. 常量池内容
    需要查表,可参考博客:https://blog.youkuaiyun.com/lioncatch/article/details/105957696
    例如查看第一个常量,接下来读到的第一个字节是01:
    在这里插入图片描述
    查下表,得知01代表1号常量类型CONSTANT_Utf8_info:
    在这里插入图片描述
    查看CONSTANT_Utf8_info类型数据结构:
    在这里插入图片描述
    第一个字节是tag,也就是01,表示CONSTANT_Utf8_info,第二个字节是长度,002F,换算成十进制就是47:
    在这里插入图片描述
    长度为多少,就需要往后数多少个字节,因此往后数47个字节:
    在这里插入图片描述
    借助工具查看内容(地址:http://www.ab126.com/goju/1711.html),或者直接看编辑器右边的内容:
    在这里插入图片描述
    在javap所得文件里查看第一个常量,结果分析正确:
    在这里插入图片描述
    再来看第二个常量:
    在这里插入图片描述
    07,代表CONSTANT_Class_info:
    在这里插入图片描述
    tag后面是两个字节的name_index,指向1:
    在这里插入图片描述
    查看javap反编译结果:
    在这里插入图片描述
    对应到源代码文件,得知ApacheEngineConfig是个类名:
    在这里插入图片描述
    以同样的方法分析得到followRedirects:
    在这里插入图片描述
    接下来几个都是Utf8类型的,这里就略过了,直接来看第9个常量:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    第10个常量:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    。。。
    一直到最后一个常量:在这里插入图片描述
    在这里插入图片描述
    5.5. 细节
    注意到常量池中有个Code:
    在这里插入图片描述
    Code对应的是下面这块区域,里面存放的是JVM指令:
    在这里插入图片描述
    为了方便以后引用,所以要将Code放入常量池中。此外,常量池中还有一个LineNumberTable:
    在这里插入图片描述

LineNumberTable,即行号表,前文所提的问题:我们执行java jvm指令时,一旦指令报错,为什么可以反馈到具体是哪一行源代码报错?就是因为LineNumberTable里面保存了JVM指令和源码的映射关系:
在这里插入图片描述
如上图所示,如果0这个JVM指令报错了,那么就可以知道对应的是源码第20行报错。

还有局部变量表,他可以解决这个问题:为什么我们在实例方法中可以使用this?
在这里插入图片描述
注意下面这个方法,它没有入参,那为什么它的locals=1呢?就是因为它隐式地把this作为第一个参数传了进去,所以我们可以在写代码的时候使用this。
在这里插入图片描述
那这些是什么意思呢?在这里插入图片描述
通常来说,下面的Z,()Z是用来描述上面的东西是什么类型的,比如followRedirects是Z类型的,getFollowRedirects是个函数,没有入参,返回值是Z。

  1. access_flag 类的权限描述符(2个字节)
    在这里插入图片描述
    同样的,查看查询手册:在这里插入图片描述在这里插入图片描述
    直接查是查不到的,因为0031是这3个权限加起来的结果:在这里插入图片描述
    可以查看javap反编译文件进行验证:在这里插入图片描述
  2. this class name 索引值(2个字节)
    在这里插入图片描述
    指向常量值第二个位置:
    在这里插入图片描述
  3. super class 索引值(2个字节)
    在这里插入图片描述在这里插入图片描述
  4. 接口数(2个字节)
    在这里插入图片描述
    由于接口数占2个字节,因此最大的接口数是FFFF,即65535
  5. 字段个数(2个字节)
    在这里插入图片描述
    有7个字段(变量),可以通过查找源码中var的个数验证:
    在这里插入图片描述
  6. field_info
    有7个字段,所以有7个field_info
    在这里插入图片描述在这里插入图片描述
    0002---->acc_private(查表) #?查表不对
    0005---->followRedirects(常量池中查找)
    0006---->Z(常量池中查找)
    0000---->0
    在这里插入图片描述
    以此类推,再数6个:
    在这里插入图片描述在这里插入图片描述在这里插入图片描述
    在这里插入图片描述
    上面这个有一个attribute,attribute结构如下:

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述

12.method_count
在这里插入图片描述
15个方法,也是按照上面的思路,查表,就可以翻译出来,每个方法的结构如下:在这里插入图片描述

就不一一翻译了。

12.5. JVM指令助记符
这部分是Code当中最重要的部分,但这些不是JVM指令,而是JVM指令助记符,底层只认识二进制:
在这里插入图片描述

尾声

a.JVM为什么要这么设计:先把常量池都填满了,后面要用的时候再通过索引来引用,保证在JVM底层能够识别的情况下,把文件压缩地越小越好
b.new对应的指令里为什么有一个dup?
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值