语法解析器:从LR(1)到CYK算法的全面解析
1. 复杂语法分析的挑战
并非所有语法都能被成功分析。例如,看似简单却有歧义的语法:
S → S+S
S → a
这种语法的分析结果并不理想,它不是LR(1)语法。
2. LR(1)解析器与下推自动机
LR(1)解析器与经典的下推自动机有相似之处,但也存在细微差别:
- 表格使用 :解析器使用ACTION和GOTO表中的变量,这些表格由编译器生成,解析器使用已创建好的表格,类似于具有固定状态和转换的机器。
- 输入处理 :下推自动机通过读取输入字符串的当前符号并移动到下一个符号进行分析,且只能从栈顶移除元素使用;而LR(1)解析器根据输入字符串的当前符号和栈顶元素选择下一步操作,不一定处理剩余字符串,也不一定从栈顶取元素。
- 符号使用限制 :下推自动机读取元素后只能使用一次,无法返回确定上一状态的当前符号;而编写解析器时可通过栈操作避免经典下推自动机的限制,例如从栈中读取元素时不取出栈顶元素(S, a, p → S’, p ),对输入符号也可采取类似操作。
- 栈操作扩展 :下推自动机没有“读取栈中2 * length(α)个元素”这样的操作。不过,由于字符串α的长度是已知的常量,且栈符号集合有限,可生成所有可能的指定长度的字符串。例如,若栈中只有元素A和B,“从栈中取三个元素”可能的序列有:
- AAA
超级会员免费看
订阅专栏 解锁全文
875

被折叠的 条评论
为什么被折叠?



