19、统计学习中的Bagging与Boosting方法解析

最新推荐文章于 2025-12-01 19:00:00 发布

day7

最新推荐文章于 2025-12-01 19:00:00 发布

阅读量27

点赞数

CC 4.0 BY-SA版权

分类专栏：工程中的统计学习文章标签： Bagging Boosting 集成学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/day7/article/details/152405540

工程中的统计学习专栏收录该内容

53 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

统计学习中的Bagging与Boosting方法解析

在统计学习领域，Bagging和Boosting是两种重要的集成学习方法，它们在提升模型性能方面发挥着关键作用。下面将详细介绍这两种方法的原理、适用场景以及实际效果。

1. Bagging方法

Bagging（Bootstrap Aggregating）是一种通过对原始训练集进行自助采样（Bootstrap Sampling），生成多个不同的训练子集，然后在每个子集上训练一个基模型，最后将这些基模型的预测结果进行聚合的方法。

1.1 Bagging的性能比较

将基于树的普通回归或分类估计 $\hat{m}(x, T)$ 和 $\hat{c}(x, T)$ 与Bagging版本 $\hat{m} {BA}(x)$ 和 $\hat{c} {BA}(x)$ 的性能进行比较。以平均平方误差（回归问题）和误分类百分比（分类问题）作为衡量泛化能力的性能指标，在独立测试集 $P$ 上进行评估。结果表明，Bagging通常能带来性能提升，在大多数应用中，预测误差或误分类率甚至可降低20 - 50%。

1.2 Bagging何时有效

为了研究Bagging的效果，考虑一个基于一般线性回归模型的人工示例：
$Y_j = \sum_{k = 1}^{p} \beta_k X_{jk} + \varepsilon_j, j = 1, \cdots, N$
其中，输入向量 $X_j$ 的维度 $p = 30$，具有 $p$ 维正态分布，均值为0，协方差矩阵表明各分量之间存在不可忽略的相关性。在这种情况下，我们通常希望找到更稀疏的模型，即只选择

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。