集成学习（二）：AdaBoost算法解释

最新推荐文章于 2024-09-27 21:46:56 发布

m_buddy

最新推荐文章于 2024-09-27 21:46:56 发布

阅读量400

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签： AdaBoost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m_buddy/article/details/79563680

机器学习专栏收录该内容

34 篇文章

订阅专栏

本文通过加法模型详细解析了AdaBoost算法的工作原理，介绍了如何利用指数损失函数来最小化错误率，并逐步推导出基函数Gm(x)及系数αm的计算方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 前言

在之前的博客中讲解了AdaBoost算法的原理，为了能够更加直观理解AdaBoost算法，常用的解释模型便是使用加法模型。

2. 加法模型解释

首先定义AdaBoost的加法模型为：

f (x) = \sum m = 1 M α m G m (x)

$f(x)=\sum_{m=1}^M\alpha_mG_m(x)$
其中

αmαm $\alpha_m$ 是基函数的系数，

Gm(x)Gm(x) $G_m(x)$ 为基函数。则就可以使用指数函数定义损失函数

L (y, f (x)) = e x p (- y f (x))

$L(y,f(x))=exp(-yf(x))$
假设经过

m−1m−1 $m-1$ 次迭代之后得到的模型为:

f m - 1 (x) = f m - 2 (x) + α m - 1 G m - 1 (x) = α 1 G 1 (x) + \dots + α m - 1 G m - 1 (x)

$f_{m-1}(x)=f_{m-2}(x)+\alpha_{m-1}G_{m-1}(x)\\ =\alpha_{1}G_{1}(x)+\ldots+\alpha_{m-1}G_{m-1}(x)$
得到第

mm $m$ 次的迭代得到

α_{m}, G_{m} (x) 和 f_{m} (x)

$\alpha_m,G_m(x)和f_{m}(x)$

f m (x) = f m - 1 (x) + α m G m (x)

$f_m(x) = f_{m-1}(x)+\alpha_{m}G_m(x)$
目标是使前向分布算法得到的

αm,Gm(x)和fm(x)αm,Gm(x)和fm(x) $\alpha_m,G_m(x)和f_{m}(x)$ 在训练数据集T上的指数损失函数最小化，即是

(α m, G m (x)) = a r g min a, m \sum i = 1 N e x p [- y i (f m - 1 (x i) + α G (x i))] = a r g min a, m \sum i = 1 N w m i e x p (α G (x i))]

$(\alpha_m, G_m(x))=arg\min_{a,m}\sum_{i=1}^Nexp[-y_i(f_{m-1}(x_i)+\alpha G(x_i))]\\ =arg\min_{a,m}\sum_{i=1}^Nw_{mi}exp(\alpha G(x_i))]$
其中

w m i = e x p (- y i f m - 1 (x i))

$w_{mi}=exp(-y_if_{m-1}(x_i))$
上式中最小化之后的

α∗m,G∗m(x)αm∗,Gm∗(x) $\alpha_m^*, G_m^*(x)$ 就是AdaBoost算法得到的

αm,Gm(x)αm,Gm(x) $\alpha_m,G_m(x)$ 。则对其进行求解就分为了两步，先求解

G∗m(x)Gm∗(x) $G_m^*(x)$ ：

G * m (x) a r g min G \sum i = 1 N w m i I (y i \neq G (x i))

$G_m^*(x)arg\min_{G}\sum_{i=1}^Nw_{mi}I(y_i\neq G(x_i))$
之后求解

α∗mαm∗ $\alpha_m^*$ ：

\sum i = 1 N w m i e x p (α G (x i))] = \sum y i = G m (x i) w m i e - α + \sum y i \neq G m (x i) w m i e α = (e α - e - α) \sum i = 1 N w m i I (y i \neq G (x i))

$\sum_{i=1}^Nw_{mi}exp(\alpha G(x_i))]\\ =\sum_{y_i=G_m(x_i)}w_{mi}e^{-\alpha}+\sum_{y_i\neq G_m(x_i)}w_{mi}e^{\alpha}\\ =(e^{\alpha}-e^{-\alpha})\sum_{i=1}^Nw_{mi}I(y_i\neq G(x_i))$
将已经求得的

G∗m(x)Gm∗(x) $G_m^*(x)$ 带入上式，对

αα $\alpha$ 求导并使倒数为0，即可得到让目标函数最小的

αα $\alpha$

α * m = 1 2 l o g 1 + e m e m

$\alpha_m^*=\frac{1}{2}log\frac{1+e_m}{e_m}$
其中

emem $e_m$ 是分类误差率：

e m = \sum N i = 1 w m i I ( y i \neq G ( x i ) ) \sum N i = 1 w m i

$e_m=\frac{\sum_{i=1}^Nw_{mi}I(y_i\neq G(x_i))}{\sum_{i=1}^Nw_{mi}}$
这里基函数权值系数的更新是与AdaBoost算法一致的，对于样本权值系数的更新是这样的

w m + 1, i = w m, i e x p (- y i α m G m (x))

$w_{m+1,i}=w_{m,i}exp(-y_i\alpha_mG_m(x))$

3. 参考

统计学习方法——李航

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。