Bootstrap aggregation(Bagging)

WARMING

这篇文章中Bootstrap指的是机器中一类减小预测误差的技巧,不是前端开发框架。

定义

Bootstrap aggregation又称Bagging,是一种重采用技术,用于减小预测误差。
从一个分布P中获取m组采样,用这个m组采分别训练m个模型,现在有一个新xx,要预测它对应的y值,这m个模型预测结果的算术平均数的预测误差,比其中一个模型的预测误差小。

为什么能减少误差

为什么重采样能减少误差,下面请看数学推导。
观测数据(x(1)1,y(1)1),...(x(1)n,y(1)n)(x1(1),y1(1)),...(xn(1),yn(1))从一个分布P从采用得到第一组采样,并满足i.i.d(i.i.d指数据从同一个分布中,随机采样获得)
现在有一个新的xx,第1组模型的预测值为Y1Y1
从分布P取mm组取样,(x1(m),y1(m)),...(xn(m),yn(m))表示第m组采用,
采用均方误差,误差的期望为:
E((Yy)2)=σ2(Y)E((Y−y)2)=σ2(Y)
m组模型的算术平局数ZZ
Z=1mi=1mYi
ZZ误差的期望是
E((Ey)2)=σ2(1mY(i))=1mσ2(Y)
由上可知道ZZ的误差是单个模型误差的1m

实际运用

上面从分布P中采了m组样本,但是实际上不能做到的,在实际中我们只有一组观测集,那怎么办呢?
方法是从观测集中随机采样,组成m组训练数据。
(xki,yki)uniform(D)(xik,yik)∼uniform(D)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值