数据挖掘笔记-分类-Adaboost-原理与简单实现

人生偌只如初见

已于 2023-01-30 18:47:01 修改

阅读量2.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： DataMining 文章标签：数据挖掘分类 Bagging Boosting Adaboost

于 2014-09-18 16:09:37 首次发布

本文链接：https://blog.youkuaiyun.com/fighting_one_piece/article/details/39373729

Adaboost是一种有监督机器学习算法，属于集成方法，通过组合多个弱分类器形成强分类器。与Bagging不同，Adaboost中弱分类器的权重不等，根据其表现调整。Adaboost在提高分类精度、允许使用各种弱分类器、避免过拟合和无需特征筛选等方面具有优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Adaboost（Adaptive Boosting）是一种原理简单，但很实用的有监督机器学习算法。说Boosting算法之前，先说下Bagging算法，他们两个都是把一些弱分类器组合起来进行分类的方法，统称为集成方法（Ensemble Method），虽然每个弱分类器分类的结果不那么准确，但是如果把多个弱分类器组合起来却可以得到相当不错的结果。同时集成方法还可以组合不同的分类器。Bagging算法大致思路是：从整体样本集合中，抽样n<N个样本，针对抽样的集合训练分类器，然后分类器进行投票，最终的结果是分类器投票的优胜结果。代表例子就是随机森林（Random Forest）。随机森林的每个弱分类器是决策树（Decision Tree），输出的类别由多个决策树分类的类别投票决定。但是，这种方法只是将分类器进行简单的组合，实际上并没有发挥出分类器组合的威力来。直到后来Freund and schapire提出了Adaboost算法，这个简单，有效的算法。Adaboost算法不同于Bagging算法的地方是：AdaBoost算法的每个弱分类器组合起来的权重不一样，而Bagging的每个弱分类器的组合权重是相等的。Adaboost原理如下图：