(十二)通俗易懂理解——决策树

本文深入浅出地介绍了决策树算法的原理,包括信息熵、信息增益和信息增益比的概念,通过具体实例展示了ID3和C4.5算法如何选择特征进行决策树构建,并涉及了CART算法及剪枝技术。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上一文讲到了信息熵的一些基础知识,而机器学习中的一个经典算法——决策树就是基于信息熵的基础上进行分析的,有关信息熵的基础知识可以回顾:

上一节内容:(十一)通俗易懂理解——信息熵

今天看到了李航的统计方法分析中讲解的决策树,觉得也是特别浅显易懂的,现在做适当终结。

首先是对熵以及信息熵进行回顾

 

接下去是对于算法5.1的理解,这个看得有点吃力的可以直接看以下例子部分。

题目如下,就是在年龄、工作、房子、信贷情况4个特征中判断是否贷款给此人。

 

 

该例子说明了如何计算信息增益。而ID3生成算法就是根据信息增益来选择特征,而C4.5则是根据信息增益比来选择特征。

通过这样的实例来说明决策树应该是非常的通俗易懂了。后面还有剪枝以及CART的生成算法,李航这本书的内容看得相对眼花缭乱些,后续看到更加通俗易懂的再在该篇进行完善补充。

 

现在来完善下CART以及剪枝内容。

 

参考文章:李航《统计方法分析》

参考文章:http://www.stat.cmu.edu/~cshalizi/350-2006/lecture-10.pdf

参考博客:决策树之 CART - ooon - 博客园

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值