AdaBoost

最新推荐文章于 2025-07-01 18:34:01 发布

fanf_zhang

最新推荐文章于 2025-07-01 18:34:01 发布

阅读量2.4k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习/数据挖掘文章标签：机器学习算法

本文链接：https://blog.youkuaiyun.com/flyfish5/article/details/52314537

机器学习/数据挖掘专栏收录该内容

13 篇文章

订阅专栏

Adaboost是一种结合多个弱分类器形成强分类器的机器学习算法。它通过训练弱分类器并计算其错误率，赋予低错误率的分类器更高权重。算法主要涉及弱分类器的训练和权值计算，其中样本权重会根据分类结果动态调整，以优化后续分类器的表现。最终，通过调整后的弱分类器组合构建出高效能的强分类器。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

adaboost简介

adaboost算法是将一系列弱分类器组合成一个强分类器的算法。所谓弱分类器是指识别错误率小于1/2，即准确率仅比随机猜测略高的学习算法。强分类器是指识别准确率很高并能在多项式时间内完成的学习算法。1
Adaboost算法依次训练弱分类器，赋予错误率低的分类器高权值，错误率高的分类器低权值，使得准确性高的分类器获得更高的‘话语权’，从而构造出一个强分类器。
可以想到，Adaboost算法主要包括两个部分：
1. 弱分类器的训练
2. 分类器权值的计算

弱分类器的训练

这里以decision stump（好像是这样的，待会再仔细写这块）为例
decision stump
classify stump从样本的某一特征中选定一个（可以多个吗？）阈值，小于此阈值的样本分为一类，否则分为另一类。此分类器的错误率较高，所以是一个弱分类器。
在训练弱分类器的时候并不是随便选取一个特征，确定一个阈值（要不怎么叫训练呢。。），而是对每一个特征中可能的阈值计算该分类器的错误率，选择一个错误率最小的分类器作为本轮训练得到的分类器。
那么问题又来了，怎么计算错误率呢？通常我们计算错误率的公式 $error=\frac{number of incorrectly classified examples}{total number of examples}$ ，而在这里错误率是加权错误率，也就是每个样本的权重是不同的，假设现在有 $n$ 个样本， $w_i$ 是第 $i$ 个样本的权重， $err_i$ 表示是否被错分，被错分 $err_i=1$ ，否则 $err_i=0$ 。则此分类器的错误率为 $error=\sum_{i=1}^nw_ierr_i$ 。
adaboost的另一个特点是上面提到的 $w_i$ ，每个样本的权重是会根据这个样本是否分类正确而变化。如果在一个分类器中第 $i$ 个样本被错分，那在训练下一个分类器时，这个样本的权重会增大，这有什么用呢？会导致我们在训练过程会优先考虑这个权重大的样本，将这个样本正确分类。

分类器权值的计算

以 $\alpha_i$ 表示第 $i$ 个分类器的权值， $err_i$ 是第 $i$ 个分类器的错误率， $\alpha_i=\frac12ln(\frac{1-err_i}{err_i})$
同时样本权值 $w_i$ 也要更新：
$w_i=\frac{w_ie^{-\alpha}}{sum(w)}$ 样本 $i$ 分类正确
$w_i=\frac{w_ie^{\alpha}}{sum(w)}$ 样本 $i$ 分类错误
其中 $sum(w)$ 起到归一化的作用

算法步骤

设有N个样本
分类器的训练：

初始化样本权值W,Wi=1/N
当循环次数 i 小于最大循环次数 MaxIter时
    for 每个特征
        计算m个可能的阈值（m是给定参数，可以是10，20，，，）
        对于每个阈值：
            分类，得到分类结果：predictY
            计算加权错误率：sigma=sum(W.T*|predictY-Y|)
            选择错误率较小的特征和阈值，作为本轮训练的分类器
    利用上步得到的错误率，计算alpha_i=(1/2)*[(1-ssigma)/sigma]
    更新样本权值W
    W_i=(W_i*exp(-alpha_i)) -->分类正确
    W_i=(W_i*exp(alpha_i))  ===>分类错误
    W=W/sum(W)
    总体分类结果：R=alpha_i*predictY
    计算全局错误率：e=（R中错误个数）/N  ---->通过R的符号判断分类
    if e==0:break

浅谈 Adaboost 算法 ↩