作者:禅与计算机程序设计艺术
1.简介
20世纪70年代提出的 AdaBoost (Adaptive Boosting) 方法是一种机器学习中的强分类器组合方法。该方法在分类任务中通过不断地训练弱分类器并将它们集成到一起形成一个强分类器,最后输出分类结果。AdaBoost 广泛应用于计算机视觉、自然语言处理、生物信息学等领域。它能够有效地克服弱分类器之间复杂度的差异,提高分类性能。
如今,人们对 Adaboost 有了更加深刻的认识。Adaboost 是一种迭代式的方法,可以逐渐增加基分类器的数量,最终合并成一个强分类器。它所采用的训练方式使得基分类器之间的关系模糊化,从而降低基分类器之间的耦合程度。这对于解决分类问题中存在的噪声点问题十分重要。
本文主要介绍 Adaboost 分类方法中最关键的弱分类器权重调整策略,即 Adaboost 算法每一轮迭代过程中的样本权重更新方式。
2.基本概念
2.1 AdaBoost
1995 年, 提出了 AdaBoost (Adaptive Boosting)算法,其主要思想是通过迭代的方式训练多个弱分类器(基本分类器),并将这些弱分类器集成为一个强分类器。弱分类器一般只根据少量训练数据进行训练,并且容易产生错误。因此,通过引入不同的弱分类器,Adabo