编译原理第三弹——语法分析

本文介绍了语法分析的基本概念,包括语法树的构造及其在词法分析基础上的作用。详细阐述了自顶向下与自底向上两种分析方法,并探讨了最左推导、最右推导、回溯现象及无限循环等问题的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习完相关词法分析的知识,我们按部就班,进行编辑器工作的第二个流程——语法分析,顾名思义,语法分析就是在词法分析的基础上进一步工作,主要针对词法分析器输出的token序列进行处理,目标当然是构造一个高效率、无误差的语法分析树。

语法分析树

   

上述图很好的解释了什么是语法树,能够识别单词所构成的句子是否符合语法规则。

语法树的构造方式

    主要分为自顶向下语法分析与自底向上语法分析,首先摆在我们面前的有两个问题需要解决。

  1. 替换当前句型中的哪个非终结符
  2. 用该非终结符的哪个候选式进行替换

针对上述问题提出解决方案。

第一个问题

    主要两种解决方案,最左推导最右推导,即每次固定选择最左边(右边)的非终结符进行替换。

其中根据最左或者最右规定产生的语法树是唯一的。

第二个问题

    这个问题相对复杂一点,一旦没有做好这步,很容易产生回溯、无限循环等问题。因此我们需要考虑多种因素产生的结果。

同时我们需要保证文法设计的合理性,避免这些情况的发生。需要针对不同构造方式进行选择。

自顶向下的语法分析

    自顶向下的语法分析,一般采用最左推导解决第一问题。根据输入流中的下一个终结符,选择最左非终结 符的一个候选式。

   自顶向下语法分析的通用形式——递归下降分析 
    单纯这样很有可能产生回溯现象。即在某一次选择产生式的时候,选择并不唯一,只能采用试探的方法,如果错了就要回溯,这样大大降低了处理效率,于是需要进行优化,我们提出预测分析,使得每一次抉择都是正确且唯一的。预测分析不仅可以解决回溯现象还能解决递归产生的无限循环。
    回溯
    首先我们应该明白回溯现象的产生原因——同一非终结符的多个候选式存在共同前缀,将导致回溯现象。

    解决—提取左公因子算法,通过改写产生式来推迟决定,等读入了足够多的输入,获得足够信息后再做出正确的选择。


    无限循环

        如果一个文法中有一个非终结符A使得对某个串α存在一个推导 ,那么这个文法就是左递归的,左递归文法会使递归下降分析器进入无限循环。

含有A→Aα形式产生式的文法称为是直接左递归,采用如下算法进行消除。


经过两步或两步以上推导产生的左递归称为是间接左递归



这个里面的都是测试数据,总共得分5分。从控制台输入,不能从文件中读取。实现了基本功能,加分项目都没有去实现,没有函数数组这些的实现。这是用C++语言写的,新建parser类别要选C++,其他对于VS的配置和C语言一样。for语句用的是枚举所有情况,你可以自行修改。 对预备工作中自然语言描述的简化C编译器的语言特性的语,设计上下文无关文进行描述 借助Yacc工具实现语法分析器 考虑语树的构造: 1.语树数据结构的设计:节点类型的设定,不同类型节点应保存哪些信息,多叉树的实现方式 2.实现辅助函数,完成节点创建、树创建等功能 3.利用辅助函数,修改上下文无关文,设计翻译模式 4.修改Yacc程序,实现能构造语树的分析器 考虑符号表处理的扩充 1.完成语法分析后,符号表项应增加哪些标识符的属性,保存语法分析的结果 2.如何扩充符号表数据结构,Yacc程序如何与Lex程序交互,正确填写符号表项 以一个简单的C源程序验证你的语法分析器,可以文本方式输出语树结构,以节点编号输出父子关系,来验证分析器的正确性,如下例: main() { int a, b; if (a == 0) a = b + 1; } 可能的输出为: 0 : Type Specifier, integer, Children: 1 : ID Declaration, symbol: a Children: 2 : ID Declaration, symbol: b Children: 3 : Var Declaration, Children: 0 1 2 4 : ID Declaration, symbol: a Children: 5 : Const Declaration, value:0, Children: 6 : Expr, op: ==, Children: 4 5 7 : ID Declaration, symbol: a Children: 8 : ID Declaration, symbol: b Children: 9 : Const Declaration, value:1, Children: 10: Expr, op: +, Children: 8 9 11: Expr, op: =, Children: 7 10 12: if statement, Children: 6 11 13: compound statement, Children: 3 12
### 编译原理龙书第8章练习题解答 #### 构建语指导翻译方案 构建一个用于将后缀算术表达式转换为前缀算术表达式的语指导翻译方案[^1]。此过程涉及定义一系列语规则,这些规则不仅描述了如何解析输入字符串,还指定了每条规则触发时应执行的动作来生成目标形式的输出。 对于这个问题而言,可以设计一套上下文无关文(CFG),其中每个产生式都关联着特定的操作以实现从逆波兰表示到标准数学记号的变化。例如: - 当遇到操作数时立即将其压入栈中; - 若读取到了运算符,则出所需数量的操作数并构造新的前缀表达式节点,之后再把该新创建的结果重新推回堆栈顶端等待后续处理; 最终当全部输入被消耗完毕以后,留在栈底的就是完整的前缀版本计算公式。 ```python def translate_postfix_to_prefix(expression): stack = [] for token in expression.split(): if is_operand(token): # 假设有一个函数is_operand判断是否为操作数 stack.append(token) elif is_operator(token): # 同样假设存在这样的辅助方 operand2 = stack.pop() operand1 = stack.pop() new_expression = f"{token} {operand1} {operand2}" stack.append(new_expression) return stack[-1] ``` 这段Python代码片段展示了如何通过遍历给定的后缀表达式列表,并利用栈结构来进行相应的变换工作。 #### DFA最小化算应用实例 考虑给出的状态机简化案例,在这里原始自动机拥有多个非终止态以及若干个接受态组成的集合。为了减少冗余路径数目从而优化模式匹配效率,采用了一种基于等价类划分的方对初始配置进行了压缩处理[^2]。具体来说就是先区分可区别的终态和非终态两大部分,接着不断细分直到不能再找到任何具有相同行为特征但归属于不同组别的情况为止。这样做的好处是可以显著降低复杂度而不改变识别能力。 #### 符号集的概念及其作用范围说明 在讨论编译器前端理论时经常会接触到`FIRST`、`FOLLOW`还有`NULLABLE`这三个重要概念[^3]。它们主要用于帮助预测分析过程中可能出现的各种情况,以便于更精确地控制句型展开的方向性和合性验证机制的设计思路。比如在一个含有间接左递归现象的文里头,就需要借助`FIRST/FOLLOW`集合的信息去消除潜在冲突点,确保LL(1)解析能够顺利进行下去而不会陷入死循环或者错误决策之中。 #### 控制流图与基本块划分示例 针对一段简单的程序逻辑,可以通过绘制对应的控制流程图形直观展示各个分支之间的关系走向[^4]。在这个例子里面可以看到整个过程被自然分割成了十一个小节——即所谓的“基础区块”,每一个都是线性的指令序列并且只有一处入口一处出口特性。这种抽象层次上的拆解有助于深入理解内部运作细节的同时也为进一步开展诸如寄存器分配之类的底层优化提供了便利条件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值