组合分布式语义学:两种具体构建及实验评估
1. 引言
在自然语言处理领域,理解句子的含义是一项极具挑战性的任务。尽管单词是句子的基本组成部分,但句子的含义远不止于其单词含义的简单叠加。人类能够轻松地推断句子的含义,然而机器在这方面却表现不佳。例如,自动搜索引擎在处理单个单词查询时表现良好,但在搜索短语和句子的含义时却不尽如人意。
目前,组合类型逻辑模型和分布式向量空间模型为解决这一问题提供了两种互补的部分解决方案。逻辑方法基于数学逻辑的经典思想,主要是弗雷格的原则,即句子的含义可以从其中单词的关系中推导出来。而分布式模型则与维特根斯坦的“意义即使用”哲学相关,单词的含义可以通过其上下文来确定。逻辑模型在理论方面表现出色,但在实践中,分布式模型的预测效果更好。
为了结合这两种模型的优势,研究人员使用逻辑、范畴论和量子信息等技术,开发了一种组合分布式语义学,将上下文含义与语法形式相结合,定义了单词串的含义为其单词含义张量积的函数。这使得句子的含义可以表示为向量,从而可以像测量词汇同义词一样测量句子的同义词。
2. 问题概述与混合解决方案
2.1 逻辑模型的局限性
在逻辑模型中,计算句子的含义需要考虑单词之间的进一步交互,这种交互通过句子的语法结构计算得到的函数来表示。例如,对于“dogs chase cats”这个句子,其语法结构可以用解析树表示,相应的函数基于动词“chase”的关系解读,使主语和宾语通过追逐关系相互作用。然而,这种方法的主要缺点是只能处理句子的真假含义,在词汇语义方面表现不佳,因此在语言任务(如搜索)中效果不佳。
2.2 向量空间模型的局限性
向量空间模
超级会员免费看
订阅专栏 解锁全文
2144

被折叠的 条评论
为什么被折叠?



