组合分布式语义模型的具体句子空间
在自然语言处理中,以适合计算机处理的形式表示单词和句子的含义是一个核心问题,它不仅具有理论研究价值,还对实际应用有着重要意义,比如能提升机器翻译、文本释义、问答系统和文章摘要等自然语言处理系统的效果。目前有两种不同的语义表示方法:分布式语义模型和形式语义模型。
1. 自然语言处理中语义表示的两种方法
- 分布式语义模型 :该模型借鉴信息检索中的几何方法,基于“意义由使用决定”的语义哲学观点,将单词的意义等同于其出现的上下文分布,通常将上下文理解为“出现在目标单词附近的标记”。在实际应用中,这些分布被建模为高维希尔伯特空间中的向量,通过几何距离度量来确定单词的语义相似度。这种方法在自然语言处理的许多领域都有应用,展现了其在建模单个单词意义方面的强大能力。然而,这类模型缺乏明确的组合操作,难以自然地处理更大文本单元的意义。
- 形式语义模型 :它是现有句法分析模型的扩展,为每个语法生成规则关联一个语义组合规则。这种模型将一些语法成分的语义解释视为函数,另一些视为参数,实现了从莱布尼茨到弗雷格的哲学观点,即自然语言是逻辑所体现的理想理性语言的不完美载体。虽然形式语义模型自然支持语法驱动的语义组合性,但它的语义表示基于谓词逻辑,在处理分类、搜索或摘要等语言处理任务时存在局限性,并且单词的基本意义是由逻辑模型规定的,难以通过经验构建。
由于两种模型各有优缺点,一些研究人员开始探索结合两者优点的组合分布式语义模型。
2. 组合分布式语义模型的数学框架
Coecke等人在2010年开发了一个组合分布
超级会员免费看
订阅专栏 解锁全文
921

被折叠的 条评论
为什么被折叠?



