文章目录
论文标题:UniK-QA:统一表示结构化和非结构化知识的开放领域问答
论文链接:https://arxiv.org/abs/2012.14610
arXiv:2012.14610v3 [cs.CL] 3 May 2022
摘要
我们研究了使用结构化、非结构化和半结构化的知识来源进行开放领域的问答,包括文本、表格、列表和知识库。与以往的工作不同,我们提出了一种统一的方法,通过将所有来源归一化为文本来处理它们,并应用检索器-阅读器模型,该模型迄今为止仅限于文本来源。我们的方法与最新的基于图的方法相比,在知识库问答任务上提高了11个百分点的结果。更重要的是,我们证明了我们的统一知识(UniK-QA1)模型是一种简单而有效的方式,可以结合异构的知识来源,并在两个受欢迎的问答基准测试NaturalQuestions和WebQuestions上分别提高了3.5和2.6个百分点的最新结果。
1 简介
回答事实性问题一直是信息检索和人工智能研究者的挑战(Voorhees和Tice,2000;Lopez等人,2011)。在最普遍的形式中,用户可以询问任何主题,答案可能存在于任何信息来源中。定义为这样的开放领域问答挑战非常广泛且复杂。尽管已经有一些成功的尝试接受了这种复杂性(例如 Ferrucci, 2012),但最近的大多数作品都对答案来源进行了简化假设,这些假设主要分为两个类别:结构化数据和非结构化文本。
一段长时间的研究旨在通过使用结构化的知识库(KB)来回答用户的问题,这种方法被称为基于知识库的问答(KBQA)。通常,一个知识库可以被视为一个知识图,它包括实体、属性以及它们之间预定义的一组关系。问题可以被回答,只要它可以用关系和存在于知识图谱中的对象的语言来表达。有了高质量、精心编纂的知识库,答案可以以相当高的精度提取出来。然而,KBQA在低答案覆盖率方面存在问题,因为建立一个广泛的KB的成本很高,另外,如果答案不是实体,许多问题根本无法使用知识库回答。
第二类工作是以大量无结构文本(如维基百科)作为答案来源的目标(陈等人,2017)。多亏了最新的机器阅读理解和技术检索的进步,仅在过去的几年里,从文本中进行开放领域问题回答(TextQA)取得了显著的进展(杨等人,2019;李等人,2019;卡普金等人,2020;顾等人,2020;伊萨卡德和格雷夫,2021)。另一方面,半结构化表格和结构化知识库可以是有价值的知识来源,然而文本问答方法仅限于将非结构化文本作为输入,错过了利用这些补充信息来源来回答更多问题的机会。
当涉及到使用结构化和非结构化信息回答问题时,一个简单的解决方案是结合专门的文本问答(TextQA)和知识库问答(KBQA)系统。输入的问题会被发送到多个子系统中,然后选择其中一个子系统输出最终的答案。虽然这种方法可以利用最先进的为不同信息来源设计的模型,但整个端到端系统的复杂度变得相当高。同时,处理需要从多个来源进行信息推理的问题也变得非常困难。
拥有一个涵盖异构信息来源的更集成的系统设计已被证明是困难的。一个主要原因是用于KBQA和TextQA的技术截然不同。这段文字主要讲述了两种不同的问答系统方法。第一种是利用图形结构和/或语义解析来将问题转换成结构化查询的基于知识库的问答系统。而第二种是TextQA,它主要采用检索器-阅读器架构,通过预训练的变换器来实现问答。最近,关于多源问答系统的研究尝试将自由文本纳入图节点(如Sun等人,2018;Lu等人,2019),以便使文本适应于基于知识库的问答方法。然而,这种方法的性能仍然不够令人信服。
在这项工作中,我们提出了一种新颖的统一知识表示(UniK-QA)方法,用于在具有异构信息源的开放领域问答。与拥有多个专门子系统或将文本纳入知识图谱的方法不同,我们将结构化数据展平并应用TextQA方法。我们的主要动机是使预训练的转换器的强大机器可用于结构化问答。此外,这种方法为简单和统一的架构打开了大门。我们可以轻松支持如列表和表格这样的半结构化来源,以及完全结构化的知识库。此外,无需特别处理定义知识库结构的模式或本体,从而可以方便地支持多个知识库。我们的UniK-QA模型在单个统一的开放领域问答模型中纳入了约2700万篇由文本和列表组成的段落、455,907个维基百科表格以及来自两个知识库(Freebase和Wikidata)的30亿条关系。
我们首先通过将KBQA建模为一个纯粹的文本问答任务来验证我们的方法。我们将KB中的所有关系表示为它们的文本表面形式,并在其中训练一个检索器-阅读器模型,就好像它们是文本文档一样。这种简单的方法效果非常好,在WebQSP数据集上的准确匹配得分比之前的最佳结果提高了11%。这一结果进一步证明了我们选择在TextQA框架下统一多源问答的正确性,因为它可以提高知识库问答的性能。
对于我们的多源问答实验,我们考虑列表、表格和知识库作为结构化信息的来源,并使用简单的启发式方法将它们转换为文本。我们模拟各种结构化来源与文本的组合,并在四个流行的开放领域问答数据集上进行评估,这些数据集从富含实体的知识库问答基准到针对自由格式文本来源的数据集都有涉及。我们的结果显示,与现有将KBQA和TextQA结合的努力不同,我们的多源UniK-QA方法在所有情况下都持续优于强大的TextQA基线。我们在两个数据集上取得了新的最先进的结果,在NaturalQuestions方面比已发表的艺术提高了3.5分,在WebQuestions方面提高了2.6分。
此外,我们考虑了实际环境,即问题来源事先未知,这在实际系统中是常见的情况。我们在来自多个基准的联合数据集上训练一个单一的多数据集模型,并证明它在这一多样化的问题集中优于所有单源基线。
2 背景与相关工作
2.1 知识库问答(KBQA)
本工作中所考虑的知识库(KB)是一个事实的集合,表示为一组主题-谓词-对象三元组。每个三元组(e1,p,e2)表示主题实体e1和对象e2之间的二元关系(例如地点、人物、日期或数字),以及它们的关系类型,即谓词p(例如capital_of,married_to等)。
现代大型知识库(KB),如Freebase(Bollacker等人,2008年)、DBPedia(Auer等人,2007年)和Wikidata(Vrandeˇci´c和Krötzsch,2014年)可以包含数十亿个描述数百万实体之间关系的三元组,使它们成为开放领域问题答案的重要来源。 当前知识库问答(KBQA)的主要方法是语义解析(Berant等人,2013;Yih等人,2015),即将自然语言问题转换为可以用于查询知识库的逻辑形式。这种方法是针对知识库的具体图结构设计的,通常不能直接应用于其他知识来源。