教育数据挖掘与在线学习系统评估
1. 教育数据挖掘在学生成绩预测中的应用
在教育领域,数据挖掘技术正发挥着越来越重要的作用。通过对学生相关数据的分析,可以找出影响学生成绩的关键因素。
在一项研究中,使用T - 检验来测试每个属性对预测变量的显著性水平。对每个假设检验的P值进行了测试,由于这些P值均小于0.05,因此在95%的置信水平下,所有从H0a到H0e的原假设都被拒绝。研究发现,学生的年龄、不及格模块数量和过往学期的成绩与最终成绩呈负相关,这表明数据集中的变量与目标属性之间存在显著的相关性。
随机森林分类器的结果显示,学生的年龄、不及格模块数量和过往学期的成绩是预测学生能否成功完成学位的最具影响力的因素。具体来说:
- 年龄较低的学生,通过学位考试的可能性较高。
- 学期中没有不及格情况的学生,更有可能获得学位。
- 过往学期成绩较高的学生,期末考试获得高分的概率相对也非常高。
这表明随机森林得出的模型有潜力用于预测学生在高等教育中的表现。该研究采用了三种分类方法进行分析,预测结果在92% - 98%之间。在除目标属性外的12个属性中,学生的年龄、不及格模块数量和过往学期的成绩被确定为预测学生最终成绩的最相关因素。
这些研究结果对教育领域的所有利益相关者,如教育工作者、课程协调员、学生和家长都有益。他们可以利用这些因素做出教育决策,为学生和学校创造更好的未来。此外,所选数据挖掘算法产生的研究结果还可用于进行各种预测,如调查提供个性化支持的影响、预测学生的学习表现、可视化学习活动、开发学习理论和模型、分析学生的行为模式以解释他们在不同策略、工具或技术下的学习表现。
不过,这项研究也存在一些