学生学业成绩预测与脑肿瘤检测分类研究
学生学业成绩预测
在教育领域,分析学生的学业表现一直是一项具有挑战性的任务。而机器学习算法为收集和分析数据以构建预测模型提供了机会,从而有助于提高学生的学业成绩。
研究目标
本次研究主要聚焦于以下三个方面:
1. 探究挂科情况和学科绩点对学生成绩的影响。
2. 研究特征选择如何帮助找出关键属性。
3. 对比集成方法和单一假设在小数据集上的表现。
研究方法
- 数据收集 :从GRIET网站收集了394名三年级第一学期计算机科学与工程专业学生的相关数据,涵盖学生成绩、人口统计和学院相关等18个属性。
- 数据预处理 :这是应用机器学习算法前的必要步骤,主要包括以下四个阶段:
- 数据清洗 :由于人为输入错误,数据集中可能存在缺失值或重复数据。采用列表删除技术,若某条记录包含缺失值,则将其整行删除。最终,数据集从394行减少到389行。
- 数据转换 :将学期平均绩点(SGPA)转换为成绩等级。SGPA范围为0 - 10,根据评分政策将其划分为八个等级,如0 - 4为F等级(不及格),4 - 5为D等级(及格)等。
- 数据可视化 :使用Google图表工具对数据集进行可视化。将学生按性别分为男性和女性(240名男性和149名女性),成绩分为“通过”和“不及格”两类。
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



