深入解析DoctorWkt/acwj项目：从解释器到x86-64汇编代码生成-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00915/article/details/148393676

深入解析DoctorWkt/acwj项目：从解释器到x86-64汇编代码生成

DoctorWkt/acwj项目是一个循序渐进构建编译器的教程项目。在第四部分中，我们将实现一个重要的里程碑：将之前的解释器转换为真正的编译器，能够生成x86-64架构的汇编代码。这一转变标志着我们从简单的表达式求值迈向了真正的代码生成阶段。

在之前的实现中，我们构建了一个AST解释器，它能够递归地遍历抽象语法树并计算结果。解释器的工作方式是即时执行，而编译器的工作方式则是代码生成。两者的核心区别在于：

我们设计了一个通用的代码生成框架(gen.c)，它负责AST的遍历和调度，而将具体的汇编代码生成委托给平台特定的实现(cg.c)。这种分层设计使得：

x86-64架构有16个通用寄存器，但在我们的初始实现中，我们保守地使用了4个寄存器(%r8-%r11)。寄存器管理包括三个核心操作：

这种简单的寄存器分配策略虽然不够高效，但足够让我们开始工作。后续可以改进为更复杂的分配算法。

除法运算：

movq %dividend, %rax
cqo               ; 符号扩展
idivq %divisor    ; 结果在%rax

除法需要特殊处理，使用固定寄存器

为了打印结果，我们需要遵循x86-64的调用约定：

我们的printint函数就是按照这个约定实现的辅助函数。

考虑表达式2 + 3 * 5 - 8 / 3，生成的汇编代码展示了完整的编译流程：

这个例子验证了我们编译器的正确性，生成的汇编代码计算结果与解释器一致。

为什么需要AST而不仅仅是即时代码生成？AST提供了几个关键优势：

在实现了基本的表达式编译后，我们可以考虑以下扩展：

这个项目展示了编译器构建的核心原理，从解释器到真正代码生成的转变是一个重要的里程碑。通过这种循序渐进的方式，我们可以深入理解编译技术的各个方面。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考