5、自然语言语法形式主义与解析初步

自然语言语法形式主义与解析初步

1. 自然语言语法形式主义
1.1 上下文无关文法(CFG)的局限性

CFG 在处理自然语言时表达能力不足。Shieber(1985)给出了正式证明,指出瑞士德语由于存在交叉串行依赖,不是上下文无关的。因为瑞士德语有格标记,所以即使在字符串语言中,依赖关系也是可见的,这使得 Shieber 能够基于弱生成能力进行论证。此外,CFG 通常不能被强词汇化,而词汇化被认为是自然语言合适语法形式主义的一个理想属性。

1.2 更强大的语法形式主义

由于 CFG 的这些缺点,催生了各种更强大的语法形式主义,它们逐渐扩展了上下文无关文法的特性:
- 树邻接文法(TAG) :不仅允许像 CFG 那样用新树替换叶子节点,还允许用新树替换内部节点。
- 线性上下文无关重写系统(LCFRS) :允许非终结符的产出不仅由单个字符串组成,还可以由非相邻字符串的元组组成。
- 范围连接文法(RCG) :甚至允许字符串在不同上下文中多次使用。

这些语法框架及其等价形式构成了一个字符串语言的层次结构,如下表所示:
| 语法形式主义 | 特点 | 是否具有适度上下文敏感性 |
| — | — | — |
| CFG | 基本的上下文无关文法,表达能力有限 | 否 |
| TAG, LIG | 扩展了 CFG 的树替换能力 | 是 |
| 树局部 MCTAG | - | - |
| LCFRS, MCFG, 简单 RCG | 非终结符产

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值