基于模版查询
基于语义解析
Semantic Parsing 自然语言转成SparQL/SQL,一种偏 linguistic 的方法,把自然语言转化为一系列形式化的逻辑形式,通过对逻辑形似进行自底向上的解析,得到一种可以表达整个问题语义的逻辑形式,通过相应的查询语句在知识库中进行查询,从而得出答案。
基于检索排序
Information Extraction 通过提取问题中的实体,在知识库中查询该实体可以得到以该实体为中心的知识库子图,子图中的每个节点或周边都可以作为候选答案,通过观察问题依据某些规则或模版进行信息抽取,得到问题特征向量,建立分类器,通过输入问题特征向量对候选答案进行筛选,得到最终答案。
流程:抽取实体,抽取属性,和KB建立链接,构建子图, 建立模型预测,给出答案

基于深度学习
Vector Modeling 根据问题得出候选答案,把问题和答案映射为分布式表达,通过训练数据对该分布式进行训练,使得问题和正确答案的向量表达得分(点乘)尽量高,模型训练完成后则可根据候选答案的向量表达和问题表达得分进行筛选,得出最终答案。
结合点:问题提取实体,抽取知识库子图,通过 dl 训练实体和子图关系,并得到 score 排序。
- Entity Linking in 100 Languages. (EMNLP 2020).
- An End-to-End Model for Question Answering over Knowledge Base with Cross-Attention Combining Global Knowledge. (ACL 2017)
- Key-Value Memory Networks for Directly Reading Documents. (ACL 2016)
- Enhancing Key-Value Memory Neural Networks for Knowledge Based Question Answering. (NAACL2019)
- Neural Symbolic Machines: Learning Semantic Parsers on Freebase with Weak Supervision. (ACL 2017)
- Improving Question Answering over Incomplete KBs with Knowledge-Aware Reader. (ACL 2019)
- UHop: An Unrestricted-Hop Relation Extraction Framework for Knowledge-Based Question Answering. (NAACL2019) 采用基于转换的搜索框架替代基于关系链的搜索来解决跳数限制的问题,在长关系链路上取得了不错的效果。
- Go for a Walk and Arrive at the Answer: Reasoning Over Paths in Knowledge Bases using Reinforcement Learning. (ICLR2018)
- Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings. (ACL 2020)
研究复杂知识图谱问答时,将知识图谱 embedding 和问题 embedding 耦合在一起。使用 roberta 模型对输入进行编码。 评测函数,构建了(头实体,问题,候选实体)三元组,头实体是问题中的主实体,问题被当作三元体中的关系,候选实体是头实体2跳内的子图。与训练知识图谱嵌入的评分机制相类似。
与 NLG 中的一篇论文(Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven Cloze Reward)思路比较接近,用图神经网络处理 KG,用语言预处理模型处理文字,然后将两者结合在一起。 - Query Graph Generation for Answering Multi-hop Complex Questions from Knowledge Bases. (ACL 2020)
这个是与KG embedding无关的方法,通过查询,应用extend,concat,aggregate操作对种子实体进行扩展,构建查询模式,采用beam search 保留k个最佳模式,并派生出7维特征向量送给nn网络,对模式进行排序。
