后剪枝技术之代价复杂性剪枝

最新推荐文章于 2025-03-15 11:02:26 发布

zhang4418876

最新推荐文章于 2025-03-15 11:02:26 发布

阅读量7k

点赞数 1

本文介绍了分类回归树中的一种后剪枝方法——代价复杂性剪枝法，并通过实例详细解释了如何计算非叶子节点的误差率增益值α，以此来决定是否对该节点进行剪枝。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考博文http://blog.youkuaiyun.com/tianguokaka/article/details/9018933

在分类回归树中可以使用的后剪枝方法有多种，比如：代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等。这里我们只介绍代价复杂性剪枝法。

对于分类回归树中的每一个非叶子节点计算它的表面误差率增益值α。

$\alpha=\frac{R(t)-R(T_t)}{|N_{T_t}|-1}$

$|N_{T_t}|$ 是子树中包含的叶子节点个数;

$R(t)$ 是节点t的误差代价，如果该节点被剪枝;

$R(t)=r(t)*p(t)$

r(t)是节点t的误差率;

p(t)是节点t上的数据占所有数据的比例。

$R(T_t)$ 是子树T_t的误差代价，如果该节点不被剪枝。它等于子树T_t上所有叶子节点的误差代价之和。

比如有个非叶子节点t4如图所示：

已知所有的数据总共有60条，则节点t4的节点误差代价为：

$R(t)=r(t)*p(t)=\frac{7}{16}*\frac{16}{60}=\frac{7}{60}$

子树误差代价为：

$R(T_t)=\sum{R(i)}=(\frac{2}{5}*\frac{5}{60})+(\frac{0}{2}*\frac{2}{60})+(\frac{3}{9}*\frac{9}{60})=\frac{5}{60}$

以t4为根节点的子树上叶子节点有3个，最终：

$\alpha=\frac{7/60-5/60}{3-1}=\frac{1}{6}$

找到α值最小的非叶子节点，令其左右孩子为NULL。当多个非叶子节点的α值同时达到最小时，取 $|N_{T_t}|$ 最大的进行剪枝。

各人理解：其实并不需要这么复杂，只需要使用当前节点，比如T4中，[错误的样本数/总样本数-SUM(叶子节点错误的样本数/总样本数)]/(叶子数-1)

即[ 7/60-（2+0+3）/60 ] / (3-1)=1 / 60

关于为什么选最小的alpha值，可以将alpha理解成从当前节点到划分结束，即到叶节点，误差的一个减少值，alpha越小，说明误差期间减少的越少，既然花这么大功夫，误差才减少了那么一丢丢，所以就宁愿不要，即减去剩下的部分，将当前节点作为叶节点。

博客等级

码龄13年

5
原创

5
点赞

12
收藏

3
粉丝

关注

私信

热门文章

最新评论

后剪枝之悲观剪枝法
炒方便面回复炒方便面: https://blog.youkuaiyun.com/weixin_41647586/article/details/89052754
后剪枝之悲观剪枝法
炒方便面: 图片显示不出来，我手打了一篇，加上了一些自己的理解，遇到相同问题的小伙伴可以去我博客里看一下。欢迎交流。
后剪枝技术之代价复杂性剪枝
赫拉拉: 为什么看不到图？
后剪枝之悲观剪枝法
微电子学与固体电子学-俞驰: [code=cpp] https://blog.youkuaiyun.com/appleyuchi/article/details/83961060 我写的能同时处理连续特征和离散特征的PEP剪枝，带完整数据集、代码、实验结果分析。 [/code]
后剪枝技术之代价复杂性剪枝
qq_38374292: 你好，请问剪枝中节点t4的节点误差代价为什么是7/16*16/60?

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。