利用教育数据挖掘预测学生成绩
1. 引言
教育升级在国家发展中起着至关重要的作用,一个国家的教育质量是培养有影响力社会成员的决定性因素。为了提升教育质量和学生的学业成绩,需要挖掘教育存储库中的学生数据,以获取有助于改进教育过程的隐藏信息。学术表现通常通过教育数据挖掘(EDM)技术实现的各种预测模型来观察。高维学生数据包含大量属性,在用于预测之前需要进行降维处理。
本文主要分为两部分,首先对选定的数据集实施不同的特征选择程序,然后进行性能预测。通过比较各方法的准确率得分,找出特征选择过程和机器学习方法的最佳组合,以获得更准确的预测结果。
2. 相关工作
近年来,高等教育水平的成绩预测受到了广泛关注,相关领域已有许多成功的研究。以下是一些具有代表性的工作:
- Asif 等人的研究 :仅使用大学前成绩以及大一和大二课程成绩,就能以合理的准确率预测毕业成绩。该研究使用了决策树、朴素贝叶斯、神经网络、随机森林等机器学习算法,同时也进行了有特征选择和无特征选择的对比。
- Cortez 和 Silva 的研究 :利用两所葡萄牙学校的数据,结合过往学校成绩、人口统计和社会数据,预测中学生两门核心课程的成绩。该研究实现了三种不同的数据挖掘目标(二分类、五级分类和回归),使用了决策树、随机森林、朴素贝叶斯和支持向量机四种数据挖掘方法。结果表明,若已知第一和/或第二学期的成绩,可实现较高的预测准确率,且学生成绩很大程度上取决于之前的考试表现。
- Yassein 等人的研究 :采用两阶段聚类技术对数据进行聚类,然后使用 C5.4 算
超级会员免费看
订阅专栏 解锁全文
1255

被折叠的 条评论
为什么被折叠?



