End-to-EndOpen-Domain Question Answering with BERTserini 论文阅读笔记

本文介绍了一种结合Bert和Anserini的阅读理解方法,通过外部知识库辅助,构建高效问答系统。利用英文维基百科数据集,对文章和段落建立索引,结合搜索引擎和finetune的Bert模型生成答案范围,选取最优答案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文链接:https://arxiv.org/abs/1902.01718


本文主要的创新点是将Bert与Anserini 相结合,构建了一个通过外部知识库从而辅助阅读理解的方法

首先使用英文维基百科数据集,对文章、段落分别建立索引,对于一个新的问题,通过搜索引擎返回top K篇文章(段落),然后feed到 fine tune好的bert reader中生成答案范围,选取分数最高的段落最为最后的答案,实际上思路是很简单的,也就是通过Bert和搜索引擎构建了一个问答系统,但是简单高效,值得参考


系统的整个框架如下: 

论文结果如下图所示:
 

 实验发现,对句子构建索引生成的结果要好于对文章建立索引,原因显而易见是由于文章中包含过多无关紧要的内容

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值