
OpenQA论文阅读
文章平均质量分 87
开放域问答论文阅读
张
这个作者很懒,什么都没留下…
展开
-
论文阅读:PReGAN Answer Oriented Passage Ranking with Weakly Supervised GAN
文章中的答案实体不一定与给定问题相关。为了解决这个问题,我们提出了一种称为PReGAN的基于生成对抗性神经网络的通道重新排序方法,该方法除了包含主题相关性的鉴别器之外,还包含了对回答能力的鉴别。目标是迫使生成器在主题相关且包含答案的段落中排名更高。在五个公共数据集上的实验表明,PReGAN可以更好地对适当的段落进行排序,这反过来提高了QA系统的有效性,并且在不使用外部数据的情况下优于现有方法。注:可回答性:即检索到的段落是否可能包含答案。原创 2023-01-05 20:13:15 · 380 阅读 · 2 评论 -
论文阅读:Pointer over Attention: An Improved Bangla Text Summarization Approach Using Hybrid Pointer Gen
尽管神经序列到序列模型在抽象文本摘要中取得了成功,但它也有一些缺点,例如重复不准确的事实细节,并倾向于重复自己。我们提出了一种混合指针生成器网络来解决事实细节再现不充分和短语重复的缺点。我们使用混合指针生成器网络来增强基于注意力的序列到序列,该网络可以生成词汇表外的单词,并提高再现真实细节的准确性,以及防止重复的覆盖机制。它产生了一个合理大小的输出文本,保留了输入文章的概念完整性和事实信息。为了评估,我们主要使用了“BANSData”1,这是一个高度采用的公开可用孟加拉语数据集。原创 2022-12-15 20:49:47 · 287 阅读 · 2 评论 -
论文阅读:Retrieval-augmented Generation across Heterogeneous Knowledge
检索增强生成(RAG)方法越来越受到NLP社区的关注,并在许多NLP下游任务上取得了最先进的性能。与传统的预训练生成模型相比,原创 2022-11-24 16:07:14 · 2563 阅读 · 0 评论 -
论文阅读:Questions Are All You Need to Train a Dense Passage Retriever
我们介绍了ART,这是一种新的语料库级自动编码方法,用于训练。原创 2022-11-23 10:30:29 · 487 阅读 · 1 评论 -
检索增强文本生成最新进展
我们介绍了检索增强文本生成的背景、动机和典型应用,总结了检索增强的文本生成的一般范式,并对检索源、检索度量和集成方法这三个检索增强文本产生的关键组件进行了比较分析。此外,人们对探索不同形式的知识(如知识库和外部文档)的知识生成越来越感兴趣[2,9,10,12,16,19,20]。它首先强调了检索增强文本生成的一般范式,然后回顾了不同文本生成任务(包括对话生成、机器翻译和其他生成任务)的显著工作,最后指出了一些局限性和不足,以便于未来的研究。虽然它展示了检索增强文本生成的普遍性,但也增加了新手入门的难度。原创 2022-11-23 09:05:22 · 554 阅读 · 0 评论 -
论文阅读Unsupervised Corpus Aware Language Model Pre-training for Dense Passage Retrieval
最近的研究证明了使用微调语言模型(LM)进行密集检索的有效性。然而,密集检索器很难训练,通常需要经过精心设计的微调管道才能充分发挥其潜力。在本文中,我们识别并解决了密集检索器的两个潜在问题:i)对训练数据噪声的脆弱性,ii)需要大批量来鲁棒地学习嵌入空间。我们使用最近提出的冷凝器预训练架构,该架构通过LM预训练学习将信息浓缩到密集向量中。在此基础上,我们提出了coCon冷凝器,它增加了一个无监督的语料库级对比损失,以预热文章嵌入空间。原创 2022-11-22 10:54:57 · 784 阅读 · 1 评论 -
论文阅读Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering
开放域问答的生成模型已被证明具有竞争力,无需借助外部知识。虽然这种方法很有前途,但它需要使用具有数十亿个参数的模型,这些参数的训练和查询成本很高。在本文中,我们研究了这些模型从检索可能包含证据的文本段落中获益的程度。我们获得了自然问题和琐事QA开放基准测试的最新结果。有趣的是,我们观察到,当增加检索通道的数量时,该方法的性能显著提高。这证明序列到序列模型提供了一个灵活的框架,可以有效地聚合和组合来自多个段落的证据。原创 2022-11-16 15:41:51 · 800 阅读 · 0 评论 -
论文阅读:Augmenting Document Representations for Dense Retrieval with Interpolation and Perturbation
密集检索模型以在密集表示空间上检索与输入查询最相关的文档为目标,因其显著的成功而受到广泛关注。此外,密集模型需要大量标记的训练数据才能获得显著的性能,而获取由人类注释的查询文档对通常很困难。为了解决这个问题,我们提出了一个简单但有效的文档增强密集检索(DAR)框架,该框架通过插值和扰动来增强文档的表示。我们用两个基准数据集验证了DAR在检索任务中的性能,表明所提出的DAR在密集检索标记和未标记文档方面显著优于相关基线。原创 2022-11-14 20:47:43 · 408 阅读 · 1 评论