计算机系统要素之汇编编译器

本文介绍了一种汇编语言编译器的设计与实现,包括处理符号声明、指令转换等核心步骤,并详细解释了A指令与C指令的二进制表示及编译流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

汇编编译器用来将汇编程序翻译为二进制的机器码程序。

 

因为是学习计算机系统要素一书而写的这一部分代码,所以,二进制代码和汇编代码规范均采用该书所定规范。

 

规范描述:

1 语法规约和文件格式

汇编程序以"hack"为后缀名,二进制代码程序文件以"asm"为后缀名。

 

二进制代码文件由一行行10组成的字符串组成,每行16位,也就是说CPU16位架构。

汇编文件也是由文本组成,每一行代表一条指令或者一个符号声明。

指令:A指令或C指令,稍后详细介绍。

符号声明:文本格式为"(变量)"形式,符号声明不产生实际代码,只是用来说明该符号代表的代码的位置。

 

2 指令

指令分为两类,A指令,即寻址指令;C指令,即计算指令;

A指令 @value

// value是一个非负十进制数

//或表示该数值的符号

对应二进制值:

0vvv vvvv vvvv vvvv

v代表数值

 

C指令 dest=comp;jump

// destjump域都可以为空

// 如果dest为空,则”=“被省略

// 如果jump为空,则”;“被省略

对应二进制值:

111a c1c2c3c4 c5c6d1d2 d3j1j2j3

a c1c2c3c4 c5c6 构成comp

d1d2d3                 构成dest

j1j2j3                     构成jump

 

 

编译器编写思路:

我们先来解决一个假设,是否每天汇编指令(除符号说明指令)对应一条二进制指令?

因为每条汇编都与一条机器码指令对应,所以上述假设成立。

 

我想编译器的实现应该分为两个过程,第一个过程先对符号进行处理,对符号进行代码指令行记录,第二个过程就是对语句进行直接翻译的过程,对语句进行翻译需要对字符串格式进行匹配,如果匹配不正确,那么就是代码语法错误了。

看上去上边就是我们工作的全部了,其实只是我们的核心思想而已,占到我们工作总量的30%-50%,所以如果感觉上边工作需要2个小时完成,那么我们的工作实际可能就需要4个小时来完成。

 

为什么有必要分为两个过程来完成?

因为,符号可能在使用时,还处于尚未定义,所以就需要向后寻找符号的值,如果暂时不处理,后期再进行处理,一方面很复杂,另一方面时间效率也不怎么样。

 

实现语言 C++

 

需要完成文件读写的工作

因为我们文件比较小,可以一次将所有内容读取出来,组织为行的形式

需要完成字符串处理的工作

左右非字符(空格或其它)字符清除

清除所有非字符字符,因为我们的汇编语言中不存在非字符的特殊形式,所以清除这些字符对汇编语言不产生影响,但会为解析格式提供便利。

需要完成二进制代码生成工作

符号与二进制代码之间定义了生成映射关系。

 

代码下载:http://ybb_y1b1b1.download.youkuaiyun.com/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值