08_集成学习

集成学习通过结合多个基础评估器(分类器或回归器)来提升模型性能。本文介绍了集成学习的两种主要类型:平均方法(如Bagging,包括随机森林)和增强方法(如AdaBoost)。Bagging通过随机抽样减少方差,而AdaBoost通过迭代调整样本权重,聚焦于难以分类的样本,从而减少偏差。随机森林是Bagging的一种,使用多个决策树并取多数投票或均值来决定预测结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

集成学习

集成学习(集成方法)是一种解决问题的思想(不是具体的算法)。操作为将若干个基本评估器(分类器&回归器)进行组合,然后使用这些基本评估器来综合对未知样本进行预测。通过这种“集思广益”的行为,比起使用单个基本评估器进行预测,集成学习具有更好的泛化能力与稳健性。

集成学习分类

集成学习可以分为以下两类:

  • 平均方法
    训练多个独立的基本评估器(评估器之间没有关联),然后对多个评估器的预测结果进行平均化。如果是分类任务,则使用多个评估器预测结果中,类别最多的作为预测结果。如果是回归任务,则使用多个评估器预测结果的均值作为预测结果。
    平均方法通过综合考量的行为,可以有效的减少方差,因此,其预测结果通常可以优于任何一个基本评估器。
  • 增强方法
    多个基本评估器是按顺序训练的,然后将若干个模型(通常是弱评估器)进行组合,进而产生一个预测能力强的模型。与平均方法不同,增强方法的多个基本评估器不是独立的,后续评估器需要依赖于之前评估器,训练过程中,会试图减少组合之后评估器的偏差。

集成学习效果

我们以二分类为例,如果存在n个分类器,每个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值