【提升（Boosting）方法】

最新推荐文章于 2025-08-27 13:44:10 发布

原创最新推荐文章于 2025-08-27 13:44:10 发布 · 置顶 · 290 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

4 篇文章

订阅专栏

本文介绍了AdaBoost算法的工作原理，包括如何调整训练数据的权值分布以及如何组合弱分类器形成强分类器。通过逐步解析算法流程，展示了如何利用加权投票机制提升分类效果。

提升方法需要回答两个问题：

一是在每一轮如何改变训练数据的权值和概率分布
二是如何将弱分类器组合成一个强分类器。

先对上述问题做简单的回答：

提高那些被前一轮弱分类器错误分类样本的权值（因为它们的数量少。需要在下一轮训练的时候给予他们更大的关注）。
加权多数表决，误差率小的分类器权值比较大。

Adaboost

输入：训练集 $T= {(x_1, y_1), (x_2, y_2), (x_3, y_3), ... , (x_N, y_N)}$ , 其中 $x\in X^{R^n}, y_i \in Y=\{ +1, -1\}$ ; 弱学习算法
输出：最终分类器G(x)

初始化权值分布 $D_{1} = (w_{1, 1}, ... , w_{1, i}, ... , w_{1, N})$
对 m = 1, … , M

1) 训练弱分类器 $G_i$
2) 计算当前弱学习器的误差率 $e_m$ :
$e m = P (G m (x i) \neq y i) = \sum G m (x i \neq y i) w m i$ $e_m =P(G_m(x_i) \neq y_i)=\sum_{G_m(x_i \neq y_i)}w_{mi}$ $e_m$ 的本质是被 $G_m(x)$ 误分类样本分类器的G_i(x).
3) 计算权值 $\alpha_m$ , $α m = 1 2 l o g 1 - e m e m$ $\alpha_m = \frac{1}{2}log\frac{1-e_m}{e_m}$ 可以看出， $e_m$ 越大，则 $\alpha_m$ 越小（误差大的权重小）。
4) 更新数据集的权值分布
$D m + 1 = (w m + 1, 1, . . ., w m + 1, i, . . ., w m + 1, N)$ $D_{m+1} = (w_{m+1, 1}, ... , w_{m+1,i}, ... , w_{m+1, N})$ $w m + 1, i = w m i Z m e x p (- α m y i G m (x i)), i = 1, 2, 3, . . . N$ $w_{m+1, i} = \frac{w_{mi}}{Z_m}exp(-\alpha_my_iG_m(x_i)), i=1, 2, 3, ... N$ $Z m = \sum j = 1 N w m j e x p (- α m y j G m (x j))$ $Z_m=\sum_{j=1}^Nw_{mj}exp(-\alpha_my_jG_m(x_j))$
$Z_m$ 是归一化因子，它使 $D_{m+1}$ 成为一个概率分布
$w_{m+1, i}$ 还可以写成：
$w m + 1, i = w m i Z m e x p (- α m), G m (x i) = y i$ $w_{m+1, i} = \frac{w_{mi}}{Z_m}exp(-\alpha_m), G_m(x_i) = y_i$
$w m + 1, i = w m i Z m e x p (α m), G m (x i) \neq y i$ $w_{m+1, i} = \frac{w_{mi}}{Z_m}exp(\alpha_m), G_m(x_i) \neq y_i$
所以，我们可以再次看出，误分类的样本的权值比正确分类的样本权值高。误分类样本的权值被放大 $e^{2\alpha_m} = \frac{e_m}{1-e_m}$
构建弱分类器的组合 $f (x) = \sum m M α m G m (x)$ $f(x) = \sum_m^{M}\alpha_mG_m(x)$
$\alpha_m$ 将决定不同分类器的权重
4.

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。