组合分布式语义学:构建与评估
1. 引言
在自然语言处理领域,理解句子的含义是一个极具挑战性且基础的问题。虽然单词是句子的基本构建块,但句子的含义远远超出了其组成单词的含义之和。人类能够轻松地推断句子的含义,然而机器在这方面却表现不佳。例如,自动搜索引擎在处理单个单词查询时表现出色,但在搜索短语和句子的含义时却不尽如人意。
目前,组合类型逻辑模型和分布式向量空间模型为解决这一问题提供了两种互补的部分解决方案:
- 组合类型逻辑模型 :基于数学逻辑的经典思想,主要依据弗雷格原理,即句子的含义可以从其中单词的关系中推导出来。
- 分布式向量空间模型 :与维特根斯坦的“意义即使用”哲学相关,单词的含义可以从其上下文确定。
逻辑模型在理论方面表现出色,但在实践中,分布式模型的预测效果更好。为了结合这两种模型的优势,研究人员开发了一种组合分布式语义学的混合范畴模型。
2. 混合解决方案概述
混合范畴模型将上下文含义与语法形式相结合,将一串单词的含义定义为其单词含义张量积的函数。这使得句子的含义可以表示为向量,并且可以像在分布式模型中测量词汇同义词一样测量句子的同义词。
2.1 具体构建
- 结构化向量空间 :后来的研究引入了使用结构化向量空间的具体构建,并在一个玩具向量空间中展示了逻辑方法的应用。
- 普通向量空间 :还介绍了使用普通向量空间的第二种构建方法。
组合分布式语义学混合模型构建与应用
超级会员免费看
订阅专栏 解锁全文
2142

被折叠的 条评论
为什么被折叠?



