利用机器学习实现学生实时成绩预测
1. 引言
在大多数教育机构中,预测学生的表现对于提供优质学习资源和体验、提升学校评级和声誉至关重要。然而,对于专注于研究生和博士后项目且学生记录较少的大学而言,这颇具挑战。本研究旨在证明对小数据集进行训练和建模的可行性,并构建具有可观准确率的预测模型,同时探索在数据集中寻找重要指标的可能性。
预测分析应用在高等教育中日益流行,它借助复杂的分析方法(包括机器学习部署)为各级学生生成高质量的表现数据。成绩是教师监测学生学业进展的重要指标之一。过去十年,教育领域提出了众多机器学习算法,本研究将全面审视用于预测学生最终成绩的机器学习算法。预测学生未来行为也很有必要,数据挖掘在这种情况下十分有利,它能检查数据集并提取数据以供后续使用。常用的预测算法包括协同过滤(CF)、机器学习(ML)、人工神经网络(ANN)和推荐系统(RS)。
本研究旨在回答以下问题:在有限数据集下,哪种机器学习模型最有效且准确率高?开发预测方法的关键指标有哪些?能否利用预测记录、个人、社会和学术特征以合理且显著的准确率预测任何学科的表现?
2. 相关工作
-
利用过往成绩预测中学成绩 :有研究展示了如何利用前学校成绩预测两门重要课程的中学成绩,使用了支持向量机(SVM)、神经网络(NN)、决策树(DT)和随机森林(RF)来测试三个不同的数据挖掘目标。相关的二元分类结果如下表所示:
| 输入设置 | NV | NN | SVM | DT | RF |
| — | — | — | — | — | — |
| A | 91.9†±0.0 | 88.3±0.7 |