深入解析DoctorWkt/acwj项目中的局部变量实现-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00371/article/details/148393855

深入解析DoctorWkt/acwj项目中的局部变量实现

acwj A Compiler Writing Journey 项目地址: https://gitcode.com/gh_mirrors/ac/acwj

前言

在编译器开发领域，局部变量的处理是一个重要里程碑。本文将详细分析DoctorWkt/acwj项目中局部变量的实现机制，帮助读者理解编译器如何处理不同作用域的变量。

符号表的结构改造

项目首先对符号表进行了扩展，新增了两个关键字段：

struct symtable {
  char *name;                   // 符号名称
  int type;                     // 基本数据类型
  int stype;                    // 结构类型
  int class;                    // 存储类别（全局/局部）
  int endlabel;                 // 函数结束标签
  int size;                     // 元素数量
  int posn;                     // 局部变量：相对于栈基指针的负偏移量
};

新增的class字段用于区分变量是全局(C_GLOBAL)还是局部(C_LOCAL)，而posn字段则记录局部变量在栈帧中的位置。

符号表管理策略

项目采用了一种高效的符号表管理方式：

全局变量从符号表起始位置开始存储
局部变量从符号表末尾向前存储
使用两个指针Globs和Locls分别跟踪下一个可用的全局和局部符号位置

这种双向填充策略有效利用了符号表空间，同时保持了符号查找的效率。

变量声明处理

项目对变量声明处理进行了重构，通过var_declaration()函数的islocal参数区分全局和局部变量声明：

void var_declaration(int type, int islocal) {
    ...
    if (islocal) {
        addlocl(Text, type, S_VARIABLE, 0, 1);  // 添加局部变量
    } else {
        addglob(Text, type, S_VARIABLE, 0, 1);  // 添加全局变量
    }
    ...
}

x86-64代码生成优化

在代码生成层面，项目实现了以下关键功能：

局部变量偏移量计算：通过cggetlocaloffset()函数为每个局部变量分配栈空间
栈对齐处理：确保栈指针按16字节对齐，满足x86-64调用约定
函数序言和尾声：正确设置和恢复栈指针

void cgfuncpreamble(int id) {
    ...
    stackOffset= (localOffset+15) & ~15;  // 计算对齐后的栈偏移
    fprintf(Outfile, "\taddq\t$%d,%%rsp\n", -stackOffset);
    ...
}

实际案例分析

通过测试程序input25.c，我们可以观察编译器生成的汇编代码：

int main() {
  char z; int y; int x;
  x=10; y=20; z=30;
}

生成的汇编代码展示了局部变量在栈上的布局：

main:
    pushq   %rbp
    movq    %rsp, %rbp
    addq    $-16,%rsp          ; 分配栈空间
    movq    $10, %r8
    movl    %r8d, -12(%rbp)    ; z在-12偏移处
    movq    $20, %r8
    movl    %r8d, -8(%rbp)     ; y在-8偏移处
    movq    $30, %r8
    movb    %r8b, -4(%rbp)     ; x在-4偏移处
    ...