决策树(decision tree)

本文介绍了决策树的概念,包括其定义、组成元素及分类算法。详细解释了ID3、C4.5和CART等决策树算法,并展示了如何通过计算最优特征来构建决策树。此外,还探讨了决策树剪枝的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、定义

决策树是一种对实例进行分类的树形结构。

决策树由结点和有向边组成。

结点有两种类型:内部节点表示一个特征或属性,叶节点表示一个类。

 

二、算法

计算最优特征子函数:不同标准导致不同类型的决策树,

ID3的最优特征选择标准是信息增益,C4.5是信息增益率,CART是节点方差的大小

 

框架:

1-输入  要分类的数据集和类别标签
2-根据某种分类规则,创建特征的划分节点(计算最优特征子函数)
3-按照该特征,划分数据集
4-根据划分子函数构建新的节点
5-检验是否符合递归终止条件
6-将划分的新节点包含的数据集和类别标签作为输入,递归执行上述步骤

 

二、决策树的剪枝

极小化决策树整体的损失函数或代价函数

 

设置一个信息增益的阀值,自下而上遍历决策树,将信息增益低于阀值的拆分进行合并

转载于:https://www.cnblogs.com/wander-clouds/p/8686154.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值