自然语言语法形式体系与解析初步
1. 自然语言语法形式体系概述
上下文无关文法(CFG)在处理自然语言时表现力不足。Shieber(1985)给出了正式证明,指出瑞士德语由于其交叉串行依赖关系而不是上下文无关的,因为瑞士德语有格标记,所以即使在字符串语言中,依赖关系也是可见的。此外,对于自然语言的合适语法形式体系,词汇化也是一个理想的属性,但一般来说,CFG 不能被强词汇化。
这些不足催生了对更强大形式体系的需求,从而产生了各种各样的语法形式体系,它们在不断扩展上下文无关文法的属性。
- 树邻接文法(TAG) :不仅允许像 CFG 那样用新树替换叶子节点,还允许用新树替换内部节点。
- 线性上下文无关递归结构(LCFRS) :允许非终结符的产出不仅由单个字符串组成,还可以由非相邻字符串的元组组成。
- 范围连接文法(RCG) :甚至允许字符串在不同上下文中多次使用。
这些语法框架及其各自的等效形式体系构成了一个字符串语言的层次结构,如下表所示:
| 语法形式体系 | 特点 |
| — | — |
| CFG | 基础的上下文无关文法,表现力有限 |
| TAG, LIG | 扩展了 CFG 的替换能力 |
| 树局部多成分树邻接文法(tree - local MCTAG) | 进一步增强了结构处理能力 |
| LCFRS, MCFG, 简单 RCG | 允许非相邻字符串元组和多次使用字符串 |
| 集合局部多成分树邻接文法(set - local MCTAG) | 特定
超级会员免费看
订阅专栏 解锁全文
931

被折叠的 条评论
为什么被折叠?



