14、支持向量机在学生教育数据分类中的应用与优化

支持向量机在学生教育数据分类中的应用与优化

1. 研究背景与数据来源

在教育领域的研究中,为了更好地了解学生的学习情况和预测学生的学业表现,需要对相关数据进行分析。本科生的入学信息,包括平均绩点(GPA)和成绩等被用于生成研究所需的数据。

有研究利用机器学习算法和个人信息来识别在线学习的退学情况。例如,Lykourentzou 等人(2009)使用了三种机器学习算法和个人信息来识别在线学习的退学情况,他们所在的雅典市政技术学院协作通信研究所赞助了在线学习团队。使用的算法包括前馈神经通路、支持向量机(SVM)和确定性集成模糊 ARTMAP。

还有研究聚焦于新生在做出最终决定时所考虑的最重要因素。Sujitparapitaya(2006)定义了“休学”“维持”和“可转移”等术语,该案例研究的数据来自美国国家学生信息交换中心,使用的算法包括逻辑回归、神经网络和 C5.0(决策树),在预测一年级学生留校率方面,C5.0 规则归纳模型表现略优于其他两种。

本研究使用的实验数据集是一个多类学生教育数据集,来自尼日利亚中北部地区一所大学的计算机科学系。该数据集包含 153 名毕业学生的记录,预测变量包括性别、年龄和他们所修的 64 门课程,类标签是他们毕业时获得的最终成绩,最终成绩有五个不同的值:一等、二等上、二等下、三等和及格。

数据集首先按 80:20 的比例分为两部分,80%的数据进行 10 折交叉验证(10 - FCV),其余 20%作为验证集用于测试阶段。即 122 个样本用于训练/构建四个 SVM 模型(使用线性、多项式、径向基和 S 型 SVM 核函数),31 个样本作为验证测试集来评估开发的 SVM 混合规则提取方法的性能。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值