[机器学习]决策树算法的理论基础

本文是作者学习决策树算法过程中的笔记,使用Tom的《机器学习》作为教材。文中探讨了决策树算法的理论基础,并提出了对信息熵增益概念的不同看法,建议直接使用期望熵进行计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

决策树学习

     

       这是我在学习机器学习时做的关于决策树算法的笔记,使用的教材是Tom的《机器学习》,关于决策树的理论基础,也发现了有一些不足(或者说仅仅是对我来说的不好理解)。如果是不妥,这应该是决策树算法的发明者Quialan的问题了,而不是Tom。个人认为关于信息熵增益的概念没有必要有的,当信息熵增益最大时也就是期望熵最小,因为信息熵增益=熵-期望熵,因而直接计算期望熵会方便一些,也不必再去计算熵;另外关于熵的理解,Quialan是从对信息编码的长度上去解释的,但如果换个角度把熵解释为获取信息的难易程度,期望熵越小对目标函数c的学习越容易,因此直接运用期望熵是合理的,从程序编码上也是行得通的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值