Bootstrap aggregation（Bagging）

最新推荐文章于 2024-12-16 10:32:51 发布

人工智障仁波切

最新推荐文章于 2024-12-16 10:32:51 发布

阅读量2.7k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习

本文链接：https://blog.youkuaiyun.com/dmsgames/article/details/81943206

机器学习专栏收录该内容

11 篇文章

订阅专栏

WARMING

这篇文章中Bootstrap指的是机器中一类减小预测误差的技巧，不是前端开发框架。

定义

Bootstrap aggregation又称Bagging，是一种重采用技术，用于减小预测误差。
从一个分布P中获取m组采样，用这个m组采分别训练m个模型，现在有一个新 $x$ ,要预测它对应的 $y$ 值，这m个模型预测结果的算术平均数的预测误差，比其中一个模型的预测误差小。

为什么能减少误差

为什么重采样能减少误差，下面请看数学推导。
观测数据 $(x_1^{(1)},y_1^{(1)}),...(x_n^{(1)},y_n^{(1)})$ 从一个分布P从采用得到第一组采样，并满足i.i.d(i.i.d指数据从同一个分布中，随机采样获得)
现在有一个新的 $x$ ,第 $1$ 组模型的预测值为 $Y_1$
从分布P取 $m$ 组取样， $(x_1^{(m)},y_1^{(m)}),...(x_n^{(m)},y_n^{(m)})$ 表示第m组采用，
采用均方误差，误差的期望为：
$E((Y-y)^2)=\sigma^2(Y)$
m组模型的算术平局数 $Z$ 为
$Z=\frac{1}{m}\sum_{i=1}^mY^i$
$Z$ 误差的期望是
$E((E-y)^2)=\sigma^2(\frac{1}{m}\sum Y^{(i)})=\frac{1}{m}\sigma^2(Y)$
由上可知道 $Z$ 的误差是单个模型误差的 $\frac{1}{m}$