学生就业能力分析与线性方程智能辅导系统
学生就业能力分析
数据属性
学生就业能力分析所涉及的数据包含多种属性,可分为以下几类:
- 人口统计数据 :如学生的唯一 ID、性别、出生日期、10 年级成绩百分比、10 年级所在学校董事会、高中毕业年份、高中毕业学校董事会、大学或学院的唯一 ID、学院层级、获得的学位、专业、毕业时的平均绩点、学院所在城市的唯一 ID、学院所在城市的层级、学院所在州的名称以及毕业年份等。
- 能力和软技能属性 :包括英语成绩、逻辑部分得分、定量能力部分得分、领域模块得分、计算机编程部分得分、电子与半导体工程部分得分、计算机科学部分得分、机械工程部分得分、电气工程部分得分、电信工程部分得分和土木工程部分得分。
- 情感属性 :有尽责性得分(反映做好工作或履行职责的愿望和认真程度)、宜人性得分(人格特质或行为特征得分)、外向性得分(人格测试中表明外向和社交程度的得分)以及神经质得分(人格测试中检查情绪变化频繁程度的得分)。
该数据集既有连续变量(如 10%、12%、平均绩点),也有分类变量(其余包括输出变量)。
数据预处理
为了让数据更适合后续的分析和建模,需要进行一系列的数据预处理操作,具体步骤如下:
1. 人口统计数据去除 :删除对就业能力没有影响的独立属性,如 ID、出生日期、学院所在城市 ID、10 年级学校董事会、学院所在州、高中毕业年份和学院 ID,处理后剩下 26 个属性。
2. 列
超级会员免费看
订阅专栏 解锁全文
1047

被折叠的 条评论
为什么被折叠?



