标题:Complex Knowledge Base Question Answering: A Survey
原文链接:Complex Knowledge Base Question Answering: A Survey
作者:Yunshi Lan*, Gaole He*, Jinhao Jiang et.al
发表年份:2022
收录期刊:
注:此文仅关注基于IR的KBQA,基于SP的KBQA请看原文。
CKBQA
基于IR的KBQA

总体流程由4个模块组成:
-
Retrival Source Construction:即根据知识库召回主题实体的子图,之后根据该主题子图进行推理
-
Question Representation:对问题输入进行编码,将NLQ转为向量形式,通常情况下,问题q会被神经网络 (如 LSTM、GRU 和 PLMs) 编码为隐藏向量q,然后与其他方法 (如注意力机制) 结合起来生成一个向量作为指令。
-
Graph Based Reasoning:根据第2步得到的推理指令,在第1步得到主题子图上进行推理
-
Answer Generation:答案生成模块根据推理状态生成答案。这类生成器主要有两种类型:(1) 实体排名生成器,它对实体进行排名,获得排名最高的实体作为预测答案;(2) 文本生成器,使用词汇表 V 生成自由文本答案。
对于复杂的知识库问答,这些模块会遇到不同的挑战。首先,检索源模块从知识库中提取一个与问题相关的图形,包括相关事实和大量噪声事实。由于源知识库的不可忽略的不完整性 [93],正确的推理路径可能不存在于提取出的图形中。这两个问题在处理复杂问题时更容易出现。其次,问题表示模块理解问题并生成指令以引导推理过程。当问题变得复杂时,这一步变得具有挑战性。之后,通过语义匹配在图形上进行推理。当处理复杂问题时,这种方法通过语义相似性对答案进行排名,而没有在图形中进行可追溯的推理,这妨碍了推理分析和故障诊断。
挑战
接下来的部分将阐述先前的工作如何应对这些挑战以及使用的先进技术。

5.2 在不完美的知识库下的推理
由于知识库的不完整性和启发式图生成策略带来的噪声图上下文,这样的主题子图永远不会完美
5.2.1 在不完整的知识库上进行推理
利用句子作为节点来补充不完整的知识

文章探讨了在处理复杂知识库问答(CKBQA)时,基于信息检索(IR)方法面临的挑战,包括知识库的不完整性和噪声、复杂语义理解和推理的不可解释性。解决方案包括利用预训练的知识库嵌入、构建精确的图谱、动态更新推理指令以及使用图神经网络和预训练语言模型(PLMs)来增强推理和理解。
最低0.47元/天 解锁文章
597





