自然语言理解中的词义投射与机器翻译
1. 词义投射的背景与概念
在自然语言处理领域,词义的理解和解释一直是一个关键且具有挑战性的问题。词义投射这一概念的起源可以追溯到20世纪70年代末,它旨在解决通过算法定位新词义这一古老且至今尚未完全解决的任务。其内容深深植根于人工智能的传统理念,即对世界的理解依赖于对世界知识的表征。这里所采用的是伪文本(PT)的形式,它类似于明斯基(Minsky)所提出的框架结构,并且与自然语言理解系统(NLUS)的一般假设相一致。
与传统人工智能假设不同的是,这里借鉴了维特根斯坦的观点,认为语言在世界知识的表征中具有首要地位,我们的表征应具有类似语言的属性,而非逻辑化且脱离语言的属性。维特根斯坦曾说过“尺子必须与被测量的事物处于同一空间”,这意味着与语言相关的知识在某些方面必须类似于语言,不能像他早期作品中所认为的那样直接与世界相连。世界知识的表征只有以类似语言的方式呈现,才能帮助确定和解释单词的新词义。
2. 偏好违反与词义投射的必要性
在日常语言使用中,违反预先设定的选择或偏好限制的情况是很常见的。例如,从一份日报头版随机选取的句子:“Mr Wilson said that the line taken by the Shadow Cabinet, that an Assembly should be given no executive powers would lead to the break - up of the United Kingdom.” 对于有一定知识背景的读者来说,理解这个句子没有问题,但其中四个斜体实体都违反了相关动词的正常偏好限制。“line”违反了“take”对物理对象的正常限制。
超级会员免费看
订阅专栏 解锁全文
1568

被折叠的 条评论
为什么被折叠?



