Rust 宏及其类型
在 Rust 中,宏在程序编译成二进制目标文件之前就完成了代码生成的神奇操作。它们接收被称为标记树(token trees)的输入,并在抽象语法树(AST)构建的第二次解析过程结束时进行展开。为了理解宏的工作原理,我们需要熟悉编译器处理源代码的过程,这有助于我们理解宏如何处理输入以及在使用不当时它们所发出的错误信息。
编译器处理源代码的过程
编译器处理源代码分为两个主要步骤:标记化和解析。
1. 标记化(Tokenization) :编译器逐字节读取源代码,并将字符分组为有意义的块,这些块被称为标记(tokens)。执行这个操作的编译器组件通常被称为标记器(tokenizer)。例如,表达式 a + 3 * 6
会被转换为标记序列 "a", "+", "3", "*", "6"
。其他标记还包括 fn
关键字、标识符、花括号 {}
、赋值运算符 =
等。在宏的术语中,这些标记被称为标记树。还有像 (
, )
, }
, {
这样的标记树,它们可以对其他标记进行分组。不过,此时的标记序列本身并不能传达如何处理和解释程序的信息,这就需要解析器登场了。
2. 解析(Parsing) :解析器将扁平的标记流转换为层次结构,以指导编译器如何解释程序。标记树被传递给解析器,解析器构建程序的内存表示,即抽象语法树(AST)。以