自然语言处理数据集收集

数据集名称 数据集简介(包含用途、用法、字段含义等) 数据集文件名称或下载链接 类别(公共或自研) 领域(非必填)
Stanford Question Answering Dataset (SQuAD) SQuAD 是斯坦福大学于2016年推出的数据集,阅读理解数据集,给定一篇文章,准备相应问题,需要算法给出问题的答案。此数据集所有文章选自维基百科,数据集的量为当今其他数据集(例如,WikiQA)的几十倍之多。一共有107,785问题,以及配套的 536 篇文章。 https://rajpurkar.github.io/SQuAD-explorer/ 公共 自然语言处理(问答系统)
facebook babi task bAbI task是Facebook提出的关于文本推理的数据集,它们是一组综合语言任务,包含了20个任务,旨在测试各种推理能力,如演绎、归纳、共指、空间和时间推理等。 https://github.com/facebook/bAbI-tasks 公共 自然语言处理(问答系统)
MS MARCO 人工生成的机器阅读理解数据集,来自微软,2016 http://www.msmarco.org/ 公共 自然语言处理(问答系统)
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值