学习中的情感与任务难度分析
1. 情感检测与数据处理
在课堂环境中,情感探测器用于识别各种情感状态,但在识别罕见情况时可能存在局限性。为解决训练数据中目标类别不平衡的问题,采取了以下操作步骤:
1. 使用随机抽样对多数类样本进行欠采样。
2. 运用 SMOTE 算法对少数类样本进行合成过采样。
经过重采样的数据包含 7 个数值特征(表示基本情绪的可能性)和一个名义二元目标类,用于训练分类器模型。
2. 分类器模型训练
采用 10 折分层交叉验证来构建二元分类器,以预测专注度、挫败感和困惑感。选择的分类器模型包括随机森林(RF)、决策树(DT)、神经网络(NN)、朴素贝叶斯(NB)和逻辑回归(LR)。其中,朴素贝叶斯和逻辑回归模型作为基线来评估模型性能。模型选择标准既考虑了可解释性,也考虑了性能,更倾向于选择逻辑回归和决策树等可解释性强的模型。
以下是不同分类器模型预测成就情绪类别的性能指标表格:
| AE | 分类器 | AUC | F1 | 准确率 |
| — | — | — | — | — |
| 困惑 | RF | 0.73 | 0.64 | 0.66 |
| 困惑 | DT | 0.70 | 0.64 | 0.66 |
| 困惑 | NN | 0.60 | 0.53 | 0.59 |
| 困惑 | NB | 0.56 | 0.45 | 0.56 |
| 困惑 | LR | 0.58 | 0.45 | 0.56 |
| 挫败感 | RF | 0.76 | 0.69 | 0.69 |
| 挫败感 | DT | 0.73 |