字节码的编译原理

最新推荐文章于 2023-08-12 19:55:15 发布

zhuguorong11

最新推荐文章于 2023-08-12 19:55:15 发布

阅读量1.4k

点赞数

分类专栏： java

java 专栏收录该内容

41 篇文章

订阅专栏

1.编译原理

java编译器在将java源码编译为一个有效的字节码文件，主要会经历4个步骤：词法解析à语法解析à语义解析à生成字节码

2.词法解析步骤

2.1词法解析过程

词法解析是javac编译器执行字节码编译的第一步。主要任务就是将java源码中的关键字和标示符等内容转换为符合java语法规范的Token序列，然后按照指定的顺序规则进行匹配校验，以便为后续的语法解析步骤做准备。

2.2 Token序列

Token无非就是一组对应源码字符集合的单词序列。简单来说，Token其实就一个枚举类型，其内部定义了许多符合java语法规范并与源码字符集合相对应的枚举常量。

2.3源码字符集合与Token之间的对应关系

问题一：源码字符集合究竟是如何转换成Token的？

答：当词法解析器需要将源码字符集合转换为Token时，就会通过Names类去调用Name类的fromChars()方法获取一个Name对象，然后在调用Keywords类的key()方法时传入这个Name对象就可以成功获取出对应Token，这样一来词法解析器即可成功地将源码字符集合转换为Token.

问题二：源码字符集合转成Token后，词法解析器是采用什么方式保存源码字符集合与Token之间的对应关系？

答：词法解析器在将源码字符转换为Token之前，会先将每一个字符集合都转换为一个对应的Name对象，也就是说，每一个源码字符集合其实就是一个Name对象，然后再由com.sun.tools.javac.parser.Keywords负责实际的Token转换任务。Keywords类会将Token中所有枚举常量全部转换为Name对象，然后将其存储在Name对象的内部类Table中，这样一来源码字符集合与Token之间对应关系就成功构成建起来了。