AdaBoost算法

原创于 2017-02-21 16:17:38 发布 · 570 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

15 篇文章

订阅专栏

一、算法思想

对于分类问题而言，给定一个训练数据集，求比较粗糙的分类规则要比求精确的分类规则容易得多。集成学习就是从弱学习算法出发，反复学习，得到一系列弱分类器，若后组合这些弱分类器，构成一个强分类器。大多数的集成学习方法都是改变训练数据集的概率分布，针对不同的训练数据分布调用弱学习算法学习一系列分类器。

对于集成学习方法有两个问题需要回答：1. 在每一轮如何改变训练数据的权值或概率分布；2. 若何将弱分类器组合成强分类器。

对于第一个问题，AdaBoost的做法是，提高那些被前一轮弱分类器错误分类样本的权值，而降低那些被正确分类样本的权值。这样一来，那些没有得到正确分类的数据，由于权值的加大而受到后一轮弱分类器的更大关注。至于第二个问题，AdaBoost采取加权多数表决的方法，具体地，加大分类误差率小的弱分类器的权值，使其在表决中起较大的作用。减小分类误差率较大的弱分类器的权值，使其在表决中起较小的作用。

AdaBoost的巧妙之处就在于它将这些想法自然且有效地实现在一种算法里。

二、AdaBoost算法

输入：训练数据集 $T={(x_1,y_1),\cdots, (x_n,y_n)}$ ,其中 $x_i \in R^n , y_i \in \{+1, -1\}$ ;弱学习算法

输出：最终分类器G(x)

(1)初始化训练数据的权值分布

D 1 = (w 11, \dots, w 1 N), w 1 i = 1 N, i = 1, 2, \dots, N

$D_1 = (w_{11} , \cdots , \ w_{1N}), \quad w_{1i} = \frac 1 N , \qquad i =1,2, \cdots,N$
(2)对

M=1,2,⋯,m $M = 1,2, \cdots , m$ (M表示第几轮)

(a)使用具有权值分布 $D_m$ 的训练数据集学习，得到基本分类器

G m (x) : X \to {- 1, + 1}

$G_m(x) : X \rightarrow \{-1,+1\}$
(b)计算

Gm(x) $G_m(x)$ 在训练数据集的上的分类误差率

e m = P (G m (x i)! = y i) = \sum i = 1 N w m i I (G m (x i)! = y i)

$e_m = P(G_m(x_i) != y_i) = \sum_{i=1}^N w_{mi}I(G_m(x_i)!= y_i)$
(c)计算

Gm(x) $G_m(x)$ 的系数

a m = 1 2 ln 1 - e m e m

$a_m = \frac 1 2 \ln \frac {1- e_m}{e_m}$
(d)更新训练数据集的权值分布

D m + 1 = {w m + 1, 1, \dots, w m + 1, N} w m + 1, i = w m i Z m e - a m y i G m (x i)

$D_{m+1}=\{w_{m+1,1}, \cdots,w_{m+1,N} \} \\ w_{m+1,i} = \frac {w_{mi}}{Z_m}e^{-a_m y_i G_m(x_i)}$
这里

Zm $Z_m$ 是规范化因子

Z m = \sum i = 1 N w m i e - a m y i G m (x i)

$Z_m =\sum_{i=1}^N w_{mi} e^{- a_m y_i G_m(x_i)}$
使得

Dm+1 $D_{m+1}$ 成为一个概率分布

(3)构建基本法分类器的线性组合

G (x) = s i g n (\sum m = 1 M a m G m (x))

$G(x)=sign(\sum_{m=1}^M a_m G_m(x))$

博客等级

码龄10年

20
原创

3
点赞

14
收藏

2
粉丝

关注

私信

TA的精选

TA的历史创作历程

分类专栏

上一篇：: CART算法

下一篇：: Bagging算法与随机森林

目录

展开全部

收起

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。