机器学习（六）：集成算法（1）Bagging

最新推荐文章于 2025-10-15 11:56:16 发布

原创

最新推荐文章于 2025-10-15 11:56:16 发布 · 1.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文深入探讨了集成算法中的Bagging方法，通过Bootstrap Aggregation（bagging）来减少模型的Variance。同时介绍了决策树CART的原理，包括如何进行分支、何时停止分支以及CART剪枝的正则化过程。接着，文章阐述了随机森林如何结合Bagging和决策树的优点，通过随机选取属性和OOB(out-of-bag)数据进行特征选择和性能评估。

1.Aggregation概论

1.1 引言

三个臭皮匠，顶个诸葛亮。
假设我们有多个预测模型 $g_1,g_2...g_T$ ,能不能将这些模型组合起来，获得更好的性能？回想一下，之前我们Validation：是在多个模型中选择出一个好的模型，现在问题变成了：多个模型组合出一个更好的模型。
能不能呢？我们从直观上来看：
这里写图片描述
我们组合是有效果的。

1.2 这么多g是怎么获得的？

这里写图片描述
如果使用 $H_1, H_2...H_T$ ，那么aggregation算法的模型复杂度则 $\ge complexity(\cup_{t=1}^TH_t)$

1.3 为什么aggregation可以起作用？

最终采用如下形式：

G (x) = 1 T \sum t = 1 T g t (x)

$G(x)=\frac 1T \sum_{t=1}^Tg_t(x)$ 假设我们试图预测的真实函数为f(x)，那么每一个g都可以表示为：

g t (x) = f (x) + ϵ t (x)

$g_t(x)=f(x)+\epsilon_t(x)$ 则G的预测的平方和误差的期望是：

E [(G - f (x)) 2] = E [(1 T \sum t = 1 T ϵ t (x)) 2]

$E[(G-f(x))^2]=E[(\frac 1T \sum_{t=1}^T\epsilon_t(x))^2]$ ，假设误差的均值是0，且不具有相关性，即

E [ϵ t (x)] = 0, E [ϵ t (x) ϵ u (x)] = 0

$E[\epsilon_t(x)]=0, E[\epsilon_t(x)\epsilon_u(x)]=0$ 则有

E [G (

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。