一、WebQuestions
提出该数据集的论文:Semantic Parsing on Freebase from Question-Answer Pairs
数据集地址:https://worksheets.codalab.org/worksheets/0xba659fe363cb46e7a505c5b6a774dc8a
WebQuestions数据集(2013年提出)是由斯坦福大学研究人员通过Google Suggest API构建得到的,数据集本身共包含5810条(问题,答案)对,其中简单问题占比在84%,复杂的多跳和推理问题相对较少。根据提出者的最初数据划分方式,WebQuestions被分为训练集和测试集两个集合,其中训练集包含3778条数据,测试集包含2032条数据。
ComplexWebQuestions
提出该数据集的论文:The web as a knowledge-base for answering complex questions