研究生录取预测模型对比分析与智能门控系统应对疫情
1. 研究生录取预测模型研究背景与意义
随着全球学术机构数量的增加,有志于攻读研究生的学生在筛选申请的大学时面临着繁琐的任务。申请大学涉及诸多关键因素,其中费用是重要的一项。若学生的申请被拒,不仅会浪费时间和金钱,还会打击学生的积极性。因此,利用机器学习和深度学习技术,基于GRE分数、TOEFL分数、本科大学排名、个人陈述(SOP)、推荐信(LOR)、平均绩点(CGPA)和研究经验等因素,预测学生申请的接受或拒绝可能性具有重要意义。
2. 相关工作回顾
此前,许多研究者在不同领域应用机器学习进行了相关研究:
- Mohan S. Acharya等使用线性回归、决策树、随机森林和支持向量回归等多种回归模型。
- D. A. Chithra Apporva等采用线性回归、K近邻、随机森林和岭回归等模型,其中线性回归表现良好。
- P. Janani等使用决策树算法预测学生在特定大学的录取可能性。
3. 研究方法
3.1 数据收集与理解
使用Kaggle上的录取数据集,包含以下属性:
| 总记录数 | 属性 | 属性类型 |
| ---- | ---- | ---- |
| 501 | 7 | 简单属性 |
| 501 | 1 | 派生属性 |
具体属性有GRE分数、TOEFL分数、大学评级、SOP、LOR、CGPA、研究经历和录取机会。
3.2 数据预处理
对所有指定属性进行预处理,使用最小 - 最大缩放器对属性进行缩放,以避免模型