从前向分步算法推导出AdaBoost

最新推荐文章于 2021-12-25 18:05:45 发布

原创

最新推荐文章于 2021-12-25 18:05:45 发布 · 4.8k 阅读

·

12

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

前向分步算法到AdaBoost

前向分步算法与AdaBoost有什么关系呢？除了都属于Boosting的模型，其实AdaBoost是当前向分步算法损失函数为指数损失时的特例。这篇就写一下推导的过程。

前向分步算法 Forward Stagewise Additive Modeling

初始化 $f_0(x) = 0$
对于 $m = 1,2,...,M$
(a)

(β m, γ m) = arg min β, γ \sum i = 1 N L (y i, f m - 1 (x i) + β b (x i; γ))

$(\beta_m,\gamma_m) = \arg\min_{\beta,\gamma} \sum_{i=1}^N L(y_i,f_{m-1}(x_i)+\beta b(x_i;\gamma))$

(b)

f m (x) = f m - 1 (x) + β m b (x; γ m)

$f_m(x) = f_{m-1}(x) + \beta_m b(x;\gamma_m)$

前向分步算法的步骤如上，其实我觉得应该翻译成前向分步累加模型更适合。因为最终的决策函数 $f(x)$ 是由一系列的基函数 $b(x;\gamma_m)$ 与相应的权值 $\beta_m$ 累加起来的。前向分步指的是，最小化损失函数获取第 $m$ 步的 $\beta b(x;\gamma)$ 时不影响之前已经获取的参数 $\gamma$ 与系数 $\beta$ 。

对于回归问题，前向分步算法的损失函数可以选平方损失，即

L (y i, f (x)) = (y i - f (x)) 2

$L(y_i,f(x)) = (y_i - f(x))^2$

所以有

L (y i, f m - 1 (x i) + β b (x i; γ)) = (y i - f m - 1 (x i) - β b (x i; γ)) 2 = (r i m - β b (x i; γ)) 2

$L(y_i,f_{m-1}(x_i)+\beta b(x_i;\gamma)) = (y_i - f_{m-1}(x_i) - \beta b(x_i;\gamma))^2 \\ = (r_{im} - \beta b(x_i;\gamma))^2$

其中 $r_{im}= (y_i - f_{m-1}(x_i))$ ，这可以理解成是当前模型的残差，为了获取 $\beta_m b(x;\gamma_m)$ ，也就是令其去拟合当前模型的残差。

而AdaBoost是个分类器，对于分类问题，平方损失就不太适合了。所以引入指数损失，即

L (y, f (x)) = e x p (- y f (x))

$L(y,f(x)) = exp(-y f(x))$

基本的AdaBoost是一个二分类模型，令其基函数 $b(x;\gamma)=G(x)$ ，所以有 $G_m(x) \in \lbrace-1,1\rbrace$ 。
则在指数损失的基础上，就需要解决如下问题

(β m, G m) = arg min β, G \sum i = 1 N e x p [- y i (f m - 1 (x i) +

最低0.47元/天解锁文章

4 条评论

Wani_Rain 2019.03.20
写的好详细，终于看懂啦

wuchen1997 2019.01.15
请问加权误差率怎么来的

只布布倩 2019.01.06
文章超级详细，谢谢博主分享。

不想当筛子 2018.12.04
不错，写的比统计学习方法清楚详细！

土肥宅娘口三三 2018.06.14
很细致的推导了，有一点不明白的地方希望能得到指教，怎么解释加权误差率中的$w^{(m)}_{i}$，和$w^{(m)}_{i}=exp(-y_i f_{(m-1)}(x_i))$之间的联系呢？
- 迟宏庆的博客回复土肥宅娘口三三 2019.10.22
  请问搞懂了吗？这个问题

Shbdc 2016.11.30
加权误差率的公式写错了。。。

评论 7

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。