机器学习在学生安置预测与冬季日峰值负荷预测中的应用
学生安置预测
在学生安置预测方面,以往的研究大多仅考虑成绩和其他学术因素来确定学生获得安置的机会。而现在的研究综合考虑了各种社会经济因素以及学术因素进行安置预测。
实验结果与分析
- 相关性矩阵(热力图) :绘制相关性热力图,以检查预测变量与最终成绩变量之间的相关性,从而了解哪些预测变量在不同分类算法中更为重要。接近 +1 的正值表示高度正相关,接近 -1 的负值表示强负相关。最终成绩变量与学期 1 成绩和学期 2 成绩的相关性最高。同时,还进行了多重共线性检查,因为强多重共线性可能导致过拟合、数据变量冗余以及重要预测变量变得不重要等问题。从热力图来看,除了学期 1 成绩和学期 2 成绩外,数据集中的预测变量没有明显的多重共线性,不过由于这两个成绩对模型很重要,其多重共线性可以忽略。
- 探索性数据分析(EDA) :
- 分析每个最终成绩对应的学生数量。
- 基于学生周末饮酒量分析最终成绩。
- 基于外出频率分析最终成绩。
- 基于学生接受高等教育的意愿分析最终成绩。
机器学习算法结果
| 使用的模型 | 模型得分 | 交叉验证得分 | 精确率 | F1 分数 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



