自然语言的句法分析
1. 句法歧义
句法歧义主要源于两个方面。一方面,存在多词性分类的单词,例如“increase”,它既可以作名词,也能作动词。另一方面,相同的符号序列可能由不同的字符串类定义应用产生。
以“People wearing hats”为例,在不同句子中其句法分析不同:
- 在 “People wearing hats is unusual” 中,“people wearing hats” 只能被归为一个字符串,即与单数动词 “is” 一致的名词替代字符串。
- 在 “People wearing hats are unusual” 中,该片段被归为不同字符串,是复数名词 “people” 加上右侧修饰语 “wearing hats”,且复数名词与复数动词 “are” 一致。
- “People wearing hats can be unusual” 这句话存在歧义,因为 “can be” 不区分单复数,所以上述两种 “people wearing hats” 的归类都是符合语法的。
句法歧义可分为临时歧义和永久歧义:
- 临时歧义 :在计算过程中产生,但在分析整个句子时会得到解决。例如,在分析 “People wearing hats is unusual” 时,分析完前三个单词后会出现临时歧义,但当 “is” 出现时,歧义就会消除。从左到右分析时,一些临时歧义会当场解决,因为左侧构建的上下文会限制在分析的某个特定点上对单词类别或句法结构的选择。
- 永久歧义 :指句子存在多种句法分析。
限制规则有助于解决歧义。例如,
超级会员免费看
订阅专栏 解锁全文
1741

被折叠的 条评论
为什么被折叠?



