Latent Retrieval for Weakly Supervised Open Domain Question Answering

最新推荐文章于 2025-05-20 22:23:34 发布

chansonzhang

最新推荐文章于 2025-05-20 22:23:34 发布

阅读量767

点赞数 1

分类专栏： NLP Papers NLP AI 文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/chansonzhang/article/details/122286754

版权

NLP Papers 同时被 3 个专栏收录

54 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

68 篇文章

订阅专栏

60 篇文章

订阅专栏

该研究提出了一种开放领域的问答系统ORQA，它学习从开放语料中检索证据，仅依赖问答对的监督信号。通过逆向克洛泽任务（ICT）预训练检索器，实现了端到端的检索和阅读理解。实验表明，对于提问者未知答案的数据集，ORQA在精确匹配性能上优于传统IR系统，提升了19个百分点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Abstract

开放领域问答系统近期的工作都假设了 support evidence 的强监督，或者假设有一个黑盒 IR 系统来检索 evidence candidates.

我们认为这二者都不是最优解，因为 gold evidence 并非总是存在，而且 QA 与 IR 存在本质上的不同。

我们是第一个证明 retriever 和 reader 也许可以从问答对中联合学习，并且不需要任何的 IR 系统。在这种设置下，从维基百科中进行 evidence retrieval 可以看成一种 latent variable.

由于从头学习是不实际的，我们使用 Inverse Cloze Task （ICT）任务来预训练 retriever.

我们在 5 种数据集上进行测试，并发现:

在提问者已经知道答案的数据集上，传统的 IR 系统，例如 BM25 就足够了
在用户真的在寻求答案的数据集上，学到的 retriever 非常关键，在 exact match 性能上超过 BM25 达 19 个点之多。

Introduction

现有的方法需要一个 IR 系统来做很多繁重的工作，即便这个 IR 系统无法在下游任务上 fine-tu

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。