探索用于教学辅助的自动问答方法
在在线课程的讨论论坛中,学生们会提出各种各样的问题,如何高效准确地回答这些问题是提升教学质量的关键。本文将介绍一种自动问答系统,用于辅助教学,同时会对比相关的现有工作,并详细阐述其方法和实验结果。
1. 相关现有工作
在课程讨论论坛中开发自动虚拟助教的现有工作相对有限。以下是一些相关的工作:
- Jill Watson :需要课程中常见的问答对列表。对于每个传入的问题,它会在列表中搜索所有问题,找到最相似的一个,如果相似度超过某个阈值,就会部署相应的答案。问答列表可以由教师和助教手动创建,这需要大量的人力;也可以来自同一课程以前开设时收集的讨论论坛数据,但当课程首次开设时,这种方法就不适用了。
- Curio SmartChat系统 :用于自定进度的中学科学课程的问答。对于学生提出的问题,它会搜索内容库,根据情况进行不同处理:如果问题易于理解且能与问答列表中的问题匹配,则直接回答;如果问题不太清楚,则向学生推荐相关内容;如果没有相关内容,则进行“闲聊”式回复。
- Discussion - Bot系统 :为每个讨论论坛问题检索相关的课程文档和以前的讨论帖子,并经过一系列基于规则的后处理步骤后呈现给学生。
大多数开放域问答系统,如DrQA,采用文档检索和答案提取/排序的两步方法。词频 - 逆文档频率(tf - idf)是一种根据文档与查询的词重叠情况来检索文档的有效方法,它会考虑文档中的频率和整个语料库的频率。这些系统通常在具有高度结构化文本的标准问答数据集上进行训练和评估,而我们的目标是探索它们在在线课程讨