上下文无关模型重塑与GF(2)上的形式语言探索
上下文无关模型重塑相关内容
- 上下文无关模型起源与发展分歧
- 上下文无关(CF)形式语法模型诞生于1956 - 1963年,具有两个主要应用方向:一是作为自然语言句子句法短语结构模型在乔姆斯基层次结构中位列第二;二是作为“巴科斯范式”用于建模像ALGOL 60这样的编程语言语法。
- 之后,这两个应用方向的研究出现分歧。用于将编程语言翻译成汇编语言的编译器开发出了如LR(k)这样的子模型,避免了歧义且便于确定性解析。而语言学领域则担忧CF模型的不足,发展出了“轻度上下文敏感”等扩展模型,其中树邻接语法(TAG)最为流行。
- CFG/L概述:通用、最难及极端歧义性
- DYKE集合 :DYKE集合是{Aj, ¯Aj, j ∈J}∗中在重复进行Aj ¯Aj = e的消除操作后能消为空字符串e的子集。在算术和逻辑表达式中,它为中缀表示法的运算符提供括号对,避免解析歧义。在CFG解析(通过PDA)中,它用于表示应用产生式A →α的起始和结束。
- Shamir定理 :该定理通过同态将每个上下文无关语言(CFL)特征化为DYKE子集。证明过程借助Greibach范式简化,定义了Φ操作,通过一系列规则判断字符串是否属于语言LS(G)。但选择合适的产生式使栈为空是一个极其非确定性的过程,不过在验证候选语言是否为CFL时很有用。
超级会员免费看
订阅专栏 解锁全文
3413

被折叠的 条评论
为什么被折叠?



