Bootstrap aggregation(Bagging)

WARMING

这篇文章中Bootstrap指的是机器中一类减小预测误差的技巧,不是前端开发框架。

定义

Bootstrap aggregation又称Bagging,是一种重采用技术,用于减小预测误差。
从一个分布P中获取m组采样,用这个m组采分别训练m个模型,现在有一个新 x x ,要预测它对应的y值,这m个模型预测结果的算术平均数的预测误差,比其中一个模型的预测误差小。

为什么能减少误差

为什么重采样能减少误差,下面请看数学推导。
观测数据 (x(1)1,y(1)1),...(x(1)n,y(1)n) ( x 1 ( 1 ) , y 1 ( 1 ) ) , . . . ( x n ( 1 ) , y n ( 1 ) ) 从一个分布P从采用得到第一组采样,并满足i.i.d(i.i.d指数据从同一个分布中,随机采样获得)
现在有一个新的 x x ,第1组模型的预测值为 Y1 Y 1
从分布P取 m m 组取样,(x1(m),y1(m)),...(xn(m),yn(m))表示第m组采用,
采用均方误差,误差的期望为:
E((Yy)2)=σ2(Y) E ( ( Y − y ) 2 ) = σ 2 ( Y )
m组模型的算术平局数 Z Z
Z=1mi=1mYi
Z Z 误差的期望是
E((Ey)2)=σ2(1mY(i))=1mσ2(Y)
由上可知道 Z Z 的误差是单个模型误差的1m

实际运用

上面从分布P中采了m组样本,但是实际上不能做到的,在实际中我们只有一组观测集,那怎么办呢?
方法是从观测集中随机采样,组成m组训练数据。
(xki,yki)uniform(D) ( x i k , y i k ) ∼ u n i f o r m ( D )

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值