31、句子结构分析:从语法困境到上下文无关文法

句子结构分析:从语法困境到上下文无关文法

一、引言

在自然语言处理中,仅仅分析单词以及词序模式远远不够,我们需要一种方法来处理自然语言中著名的歧义问题,同时要应对可能存在无限数量句子的情况。接下来,我们将深入探讨如何使用形式语法描述无限句子集合的结构、如何用语法树表示句子结构以及解析器如何分析句子并自动构建语法树。

二、一些语法困境

(一)语言数据与无限可能性

在处理电子语言数据时,我们会思考一个巨大的英语语料库是否能代表“现代英语”。实际上,即使在网络上能找到像 “New man at the of IMG” 这样包含 “the of” 词序的例子,但英语使用者会认为这些大多是错误的,不属于英语的一部分。这表明 “现代英语” 并不等同于语料库中所有的词序集合,英语使用者能够判断某些词序是否符合语法。

另一方面,句子具有可以嵌入更大句子的特性。例如:
- a. Usain Bolt broke the 100m record.
- b. The Jamaica Observer reported that Usain Bolt broke the 100m record.
- c. Andre said The Jamaica Observer reported that Usain Bolt broke the 100m record.
- d. I think Andre said the Jamaica Observer reported that Usain Bolt broke the 100m record.

如果用符号 S 代替整个句子,我们会看到 “Andr

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值