决策树学习1-信息增益划分实例计算

本文详细介绍决策树算法的计算流程,包括决策树生成过程中的三种停止条件及递归计算的特殊情况处理。通过具体实例,展示了如何根据信息增益选择最优划分属性,构建决策树模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 算法流程及说明

首先给出决策树计算流程,该图来自于周志华老师的《机器学习》(经典教材)
决策树计算流程
书中提到,有三种情形会导致递归返回:

  • 1 当前节点包含的样本属于同一类别;
  • 2 当前属性集为空或者所有样本在所有属性上的取值相同
  • 3 当前节点包含的样本集合为空

并且强调了:

  • 第2种情形将该节点中含样本最多的类别作为该节点的类别
  • 第3种情形将父节点中含样本最多的类别作为该节点的类别

个人认为这两点的强调很重要,否则在递归计算过程中会出错。

理论知识会再写一篇文章进行阐述,本文接下来重点给出当选择标准为信息增益时,决策树的生成过程,剪枝的部分会在另一篇文章阐述。(由于整个计算过程是采用onenote记的笔记,故在这里给出整个笔记的截图)

2. 实例计算

数据集

2.1 得到第一层结构

第一层

2.2 得到纹理="清晰"子树

2.2

2.2.1 得到根蒂="稍蜷"子树

2.2.1

2.2.1.1 得到色泽="乌黑"子树

2.2.1.1

2.3 得到纹理="稍糊"子树

2.3

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值