教师问题检测的神经多任务学习
1. 相关工作
- 教师问题检测
- 早期的研究主要集中在从教师语音中检测问题并进行二分类,即区分问题和非问题。例如,Blanchard 等人基于音频输入对问答话语段进行分类,先通过简单的幅度包络阈值法检测教师话语,再提取 11 个语音 - 静音特征训练监督分类器。之后,他们引入自动语音识别(ASR)系统,将音频特征转换为通用语言特征,并从 ASR 转录中提取 37 个 NLP 特征,训练不同的经典机器学习模型进行问题检测。Donnelly 等人尝试使用韵律和语言特征进行监督问题分类,发现语言特征能使机器学习分类器获得更好的性能。
- 除了二分类,也有研究关注将问题分类到特定类别。Samei 等人构建机器学习模型预测实时课堂中问题的“吸收性”和“真实性”,从每个问题中提取 30 个与词性和预定义关键词相关的语言特征,结果表明机器学习模型的问题检测性能可与人类专家相媲美。
- 与以往基于手动选择语言和声学特征构建问题检测机器学习模型的工作不同,本文方法消除了特征工程的工作量,直接从 ASR 转录中学习有效表示,并引入多任务学习技术对不同类型的问题进行分类。
- 多任务学习
- 多任务学习是一种有前景的学习范式,旨在利用多个相关任务中共享的信息来提高所有任务的泛化性能。在多任务学习中,模型同时针对不同任务进行多目标训练,所有或部分任务相关。研究表明,联合学习多个任务比单独学习每个任务能取得更好的性能。
- 例如,Yang 等人提出一种新