李航:统计学习方法 学习笔记 5 决策树三问

1. 随机变量X的信息熵的上界

在这里插入图片描述
在这里插入图片描述
参考:关于信息熵最大值的讨论

2. 决策树中的信息增益特征选择法能否运用到其他模型?

个人感觉不可以,因为决策树中分类是基于if-then集合规则或条件概率的,不同模型的分类评价方法可能不一样。例如,利用信息增益筛选出来的特征对感知机不一定适用,也即if-then规则和决策超平面不一定相容。

3. CART树剪枝

在这里插入图片描述
5.29 式如何解释?不考虑正则项的话,以 t 为单结点的树的损失函数总是大于以 t 为根节点的子树 Tt 的损失函数?因为决策树总是向着过拟合的方向生长?
在这里插入图片描述

实际上这个g(t)表示剪枝的阈值,即对于某一结点a,当总体损失函数中的参数alpha = g(t)时,剪和不剪总体损失函数是一样的(这可以在书中(5.27)和(5.28)联立得到)。

参考:决策树剪枝(cart剪枝)的原理介绍

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值