编译原理之美 --- 04 | 语法分析(二):解决二元表达式中的难点

核心

循环代替左递归。

代码

以前:

	'''
    语法解析:加法表达式
    '''
    def additive(self, tokens):
        child1 = self.multiplicative(tokens)
        node = child1
        token = tokens.peek()
        if (child1 != None and token != None):
            if (token.token_type == TokenType.Plus or token.token_type == TokenType.Minus):
                token = tokens.read()
                child2 = self.additive(tokens)
                if (child2 != None):
                    node = SimpleASTNode(ASTNodeType.Additive, token.token_text)
                    node.addChild(child1)
                    node.addChild(child2)
                else:
                    raise "invalid additive expression, expecting the right part."
        return node

现在

 	'''
    语法解析:加法表达式
    '''
    def additive(self, tokens):
        child1 = self.multiplicative(tokens) # 应用add规则
        node = child1
        if (child1 != None):
            while True:  # 循环应用add'
                token = tokens.peek()
                if (token != None and (token.token_type == TokenType.Plus or token.token_type == TokenType.Minus)):
                    token = tokens.read() # 读出加号
                    child2 = self.multiplicative(tokens)  # 计算下级节点
                    node = SimpleASTNode(ASTNodeType.Additive, token.token_text)
                    node.addChild(child1)  # 注意,新节点在顶层,保证正确的结合性
                    node.addChild(child2)
                    child1 = node
                else:
                    break
        return node

结果

以前:

计算: 2+3+4,结合性出现错误。
@ASTNodeType.Programm Calculator
@	ASTNodeType.Additive +
@		ASTNodeType.IntLiteral 2
@		ASTNodeType.Additive +
@			ASTNodeType.IntLiteral 3
@			ASTNodeType.IntLiteral 4
| Calculating: ASTNodeType.Programm
|	 Calculating: ASTNodeType.Additive
|		 Calculating: ASTNodeType.IntLiteral
|		 Result: 2
|		 Calculating: ASTNodeType.Additive
|			 Calculating: ASTNodeType.IntLiteral
|			 Result: 3
|			 Calculating: ASTNodeType.IntLiteral
|			 Result: 4
|		 Result: 7
|	 Result: 9
| Result: 9

现在

计算: 2+3+4
@ASTNodeType.Programm Calculator
@	ASTNodeType.Additive +
@		ASTNodeType.Additive +
@			ASTNodeType.IntLiteral 2
@			ASTNodeType.IntLiteral 3
@		ASTNodeType.IntLiteral 4
| Calculating: ASTNodeType.Programm
|	 Calculating: ASTNodeType.Additive
|		 Calculating: ASTNodeType.Additive
|			 Calculating: ASTNodeType.IntLiteral
|			 Result: 2
|			 Calculating: ASTNodeType.IntLiteral
|			 Result: 3
|		 Result: 5
|		 Calculating: ASTNodeType.IntLiteral
|		 Result: 4
|	 Result: 9
| Result: 9

课程:https://time.geekbang.org/column/article/120388
代码:https://github.com/buyouran1/PlayWithCompiler

词法分析 一、实验目的: 通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。 编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。并依次输出各个单词的内部编码及单词符号自身值。(遇到错误时可显示“Error”,然后跳过错误部分继续显示) 、实验说明 1、 词法分析器的功能和输出格式 词法分析器的功能是输入源程序,输出单词符号。词法分析器的单词符号常常表示成以下的元式(单词种别码,单词符号的属性值)。本实验中,采用的是一类符号一种别码的方式。 2、 单词的BNF表示 -> ->|| |ε -> -> |ε -> + -> - -> > -> >= 三、实验要求 (一)准备: 1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。 2.初步编制好程序。 3.准备好多组测试数据。 ()上课上机: 将源代码拷贝到机上调试,发现错误,再修改完善。 第次上机调试通过。 (三)程序要求: 程序输入/输出示例: 如源程序为C语言。输入如下一段: main() { int a,b; a = 10; b = a + 20; } 要求输出如下: (2,”main”) (5,”(“) (5,”)“) (5,”{“) (1,”int”) (2,”a”) (5,”,”) (2,”b”) (5,”;”) (2,”a”) (4,”=”) (3,”10”) (5,”;”) (2,”b”) (4,”=”) (2,”a”) (4,”+”) (3,”20”) (5,”;”) (5,”}“) 要求: 识别保留字:if、int、for、while、do、return、break、continue; 单词种别码为1。 其他的都识别为标识符;单词种别码为2。 常数为无符号整形数;单词种别码为3。 运算符包括:+、-、*、/、=、>、=、<=、!= ; 单词种别码为4。 分隔符包括:,、;、{、}、(); 单词种别码为5。 以上为参考,具体可自行增删。 (四)程序思路 这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。 0.定义部分:定义常量、变量、数据结构。 1.初始化:从文件将源程序全部输入到字符缓冲区中。 2.取单词前:去掉多余空白。 3.取单词后:去掉多余空白(可选,看着办)。 4.取单词:利用实验一的成果读出单词的每一个字符,组成单词,分析类型。(关键是如何判断取单词结束?取到的单词是什么类型的单词?)
### 编译原理中递归下降语法分析器生成抽象语法树并进行属性计算的方法 #### 1. 递归下降语法分析器简介 递归下降语法分析是一种自顶向下的解析技术,适用于LL(1)文法。该方法的核心思想是为每一条语法规则编写一个对应的函数[^3]。当遇到某个非终结符时,调用与其匹配的函数;如果遇到终结符,则直接比较输入流中的下一个符号。 #### 2. 抽象语法树(AST)构建过程 在递归下降的过程中,可以通过创建节点对象的方式逐步构建抽象语法树。例如,在解析表达式 `a + b * c` 的过程中: - 首先识别到加号运算符 `+`,此时会创建一个新的元操作节点 `AddExprNode`。 - 接着继续深入解析右侧子表达式 `b * c`,再进一步分解为乘法操作节点 `MulExprNode` 和两个叶子节点 `Scalar(b)` 及 `Scalar(c)`。 - 将这些节点按照层次关系连接起来形成一棵完整的树结构。 以下是伪代码示例展示如何实现这一逻辑: ```cpp // 定义基础节点基类 class ASTNode { public: virtual ~ASTNode() {} }; // 表达式节点派生类 class BinaryOpNode : public ASTNode { private: char op; // 运算符 '+', '-', '*', '/' ASTNode* lhs; // 左孩子指针 ASTNode* rhs; // 右孩子指针 public: BinaryOpNode(char operation, ASTNode* left, ASTNode* right); void evaluate(); // 计算数值结果 }; ``` #### 3. 属性计算机制 对于抽象语法树来说,有两种类型的属性需要考虑——继承属性与综合属性。前者由父节点传递给子节点,后者则是基于子节点的信息向上反馈至更高层节点的结果值[^4]。 假设我们要对上面提到的例子做求值处理,具体步骤可能如下所示: - 初始化根节点 (即最外层加法),设置初始上下文中变量 'a'='7','b'=8,'c'=9; - 自底而上依次访问各个内部节点及其关联叶节点,依据当前绑定环境得出局部解果; - 合并所有分支路径上的贡献值得到最后总答案。 实际编码时可采用后序遍历模式来同步完成整个流程控制以及动态更新所需参数列表等工作项。 #### 结论总结 综上所述,利用递归下降方式能够有效建立起针对特定目标语言的有效语法剖析框架,并且借助精心设计的数据模型支持后续阶段诸如优化变换之类的高级功能扩展需求得以顺利开展下去。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值