知识图谱问答(KBQA)数据集介绍

本文介绍了KBQA领域的几个重要数据集,包括WebQuestions、ComplexWebQuestions、SimpleQuestions、ComplexQuestions和GraphQuestions,详细阐述了每个数据集的来源、特点、规模以及应用场景,为研究知识图谱问答提供参考资料。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、WebQuestions

提出该数据集的论文:Semantic Parsing on Freebase from Question-Answer Pairs

数据集地址:https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a

WebQuestions数据集(2013年提出)是由斯坦福大学研究人员通过Google Suggest API构建得到的,数据集本身共包含5810条(问题,答案)对,其中简单问题占比在84%,复杂的多跳和推理问题相对较少。根据提出者的最初数据划分方式,WebQuestions被分为训练集和测试集两个集合,其中训练集包含3778条数据,测试集包含2032条数据。

ComplexWebQuestions

提出该数据集的论文:The web as a knowledge-base for answering complex questions

数据集地址:https://www.tau-nlp.org/compwebq

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值