数据分析在心理健康教育与创新创业教育中的应用研究
一、决策树在新生心理健康预测中的应用
- 训练样本集与ID3算法
- 训练样本集包含了一些新生的相关属性信息,如内向性、家庭和谐情况、遗传疾病、经济困难和精神疾病等,具体样本数据如下表所示:
|编辑编号|内向性|家庭和谐|遗传疾病|经济困难|精神疾病|类别|
| ---- | ---- | ---- | ---- | ---- | ---- | ---- |
|1|否|是|无|是|无|/|
|2|否|否|无|否|无|/|
|3|是|是|无|否|无|/|
|4|是|否|有|否|有|/|
|5|否|是|无|是|无|/| - ID3算法以信息增益作为分类属性的选择标准。对于该样本集,需要计算每个属性的信息增益,信息增益越大,分类的重要性就越高。
- 具体操作步骤如下:
- 步骤1:计算每个属性的信息增益。
- 步骤2:选择信息增益最大的属性CI作为树(或子树)的根节点。
- 步骤3:将在CI上取值相同的样本归为同一子集,该值作为树的一个分支。若Ci有多个值,则有多个子集,每个值都作为树的一个分支。
- 步骤4:对同时包含正例和反例的样本子集递归调用树构建过程。
- 步骤5:若子集只包含正例或反例,在相应分支上标记P或N并返回调用函数。由于训练样本集包含噪声数据,生成的决策树会比较复杂。
- 训练样本集包含了一些新生的相关属性信息,如内向性、家庭和谐情况、遗传疾病、经济困难和精神疾病等,具体样本数据如下表所示:
超级会员免费看
订阅专栏 解锁全文
522

被折叠的 条评论
为什么被折叠?



