自然语言处理中的增强语法与语义解析
1. 增强语法的引入
在自然语言处理中,传统的上下文无关语法存在一定的局限性。并非每个名词短语(NP)都能以相同的概率出现在各种上下文中。例如,“I ate a banana” 是符合语法的句子,而 “Me ate a banana” 则不符合语法规则,“I ate a bandanna” 虽然语法正确,但出现的可能性较低。
这是因为传统语法主要关注词汇类别,如代词。虽然 “I” 和 “me” 都是代词,但只有 “I” 能作句子的主语;“banana” 和 “bandanna” 都是名词,但 “banana” 更有可能成为 “ate” 的宾语。语言学家指出,代词 “I” 处于主格(即作动词的主语),“me” 处于宾格(即作动词的宾语),并且 “I” 是第一人称单数。
像代词这样,通过 “主格、第一人称单数” 等特征进行增强的类别被称为子类别。增强语法中的非终结符不再只是像代词或 NP 这样的原子符号,而是结构化的表示。例如,名词短语 “I” 可以表示为 NP(Sbj,1S,Speaker),意味着 “一个处于主格、第一人称单数且含义为句子说话者的名词短语”;而 “me” 则表示为 NP(Obj,1S,Speaker),表明它处于宾格。
对于 “Noun and Noun or Noun” 这样的序列,上下文无关语法无法表达对某种解析的偏好。而增强语法可以解决这个问题,例如我们希望语法更倾向于 “[[spaghetti and meatballs] or lasagna]” 和 “[spaghetti and [pie or cake]]” 这样的解析。
增强语法与语义解析技术
超级会员免费看
订阅专栏 解锁全文
834

被折叠的 条评论
为什么被折叠?



