形式化方法:连接逻辑形式与向量空间词汇语义
1. 引言
逻辑形式的自然语言意义表示历史悠久,一阶逻辑能强大且灵活地表达复杂命题。但仅使用一阶逻辑形式构建的系统往往很脆弱,因为它们无法整合不确定知识,通常高精度但低召回率。
近年来,计算语言学的进展带来了使用统计驱动加权模型的可靠方法。例如,词汇意义的分布式模型通过将上下文中单词的意义表示为高维语义空间中的一个点,成功用于判断释义的适用性。然而,这些模型仅处理单词意义,未解决为完整句子提供意义表示的问题。如何将这些模块的加权或概率信息与基于逻辑的表示有效整合,以实现两者的推理,仍是一个长期未决的问题。
本文的目标是建立一个正式系统,将基于逻辑的意义表示与加权信息整合到一个统一的框架中。这样可以充分发挥一阶逻辑的表达能力,并进行概率推理,从而实现更完整、更可靠的自然语言理解方法。
为实现这一目标,本文提出了第一步,即提供一种将向量空间中的分布式词相似性信息注入一阶逻辑形式的机制。我们定义了从逻辑形式的谓词符号到向量空间中点的映射,主要目的是将向量空间中的推理投影到逻辑形式中。所使用的推理规则基于可替换性,在适当构建的分布式表示中,两个单词或表达式的分布式相似性表明在文本中一个可以替换另一个,这种替换关系可以用推理规则表示,并根据分布式信息确定规则在给定句子上下文中的适用程度,该程度可作为推理规则的权重。
本文首先介绍将向量空间推理投影到逻辑形式的正式框架,然后展示该框架如何应用于实际的逻辑语言和向量空间,以解决词义歧义问题。最后,展示通过该方法生成的加权推理规则如何与一阶逻辑形式适当交互,以产生正确的推理。我们的实现使用马尔可夫逻辑网络(MLN)作为概率推理的底层引擎,能够证明MLN可以正确整合
超级会员免费看
订阅专栏 解锁全文
1544

被折叠的 条评论
为什么被折叠?



