多跳问答数据集与逻辑本体构建
1. 多跳问答数据集
在知识组合的检索和推理模型开发中,一些关键维度对于评估现有数据集至关重要。科学领域的可用数据集对每个问题需要不同的推理技术,而QASC数据集能明确识别两个事实,这些事实由Mechanical Turkers判定足以回答问题,且存在于相关语料库中,可用于模型开发。
网络领域的多跳数据集使用复杂问题来连接多个句子,以下是一些常见的多跳问答数据集:
1. WikiHop :包含基于知识图中边的元组形式问题,但缺乏自然文本问题或可用于回答问题的段落注释。
2. ComplexWebQuestions :通过将知识库中的多跳路径转换为文本查询得到,问题可分解为反映知识图路径中边的更简单查询。
3. HotPotQA :由众包工作者使用一对维基百科页面创作的多跳问题混合而成,由于其领域和任务设置,问题可较好地分解。
4. DROP :基于文本的推理和聚合操作(如计数或加法),大多数查询对文本块执行数学运算。
5. OpenBookQA :包含多项选择题和科学事实语料库,每个问题需要将核心事实与额外知识结合,但不清楚需要多少额外事实,以及这些事实是否能从现有知识源中检索到。
6. MultiRC :使用段落创建多跳问题,但更强调段落话语和实体跟踪,而非关系组合。
7. QASC :每个问题通过组合文本语料库中的一对事实构建,作者给M
超级会员免费看
订阅专栏 解锁全文
1123

被折叠的 条评论
为什么被折叠?



