AdaBoost 算法：回归问题

最新推荐文章于 2024-09-26 16:34:22 发布

原创

最新推荐文章于 2024-09-26 16:34:22 发布 · 1.3w 阅读

52 ·

CC 4.0 BY-SA版权

本文为博主原创文章，未经博主允许不得转载。

文章标签：

#AdaBoost #回归问题

前言

在《统计学习方法》这本书中介绍了基于分类问题的AdaBoost方法，其中更新样本权重采用的是 $y_i != G(x_i)$ ，其实当时就思考这样一个问题：如果用于回归任务，那么这个更新样本权重该如何计算？本文基于此问题展开讨论。对此问题有疑问的请参考博客提升方法（boosting）和AdaBoost详解
。

AdaBoost 回归算法

我们都知道回归预测得到的结果是数值，比如房子价格，每一个房产样本都有一个房产价格，这个价格是一个数值，不同的房产价格可能是不一样的，且价格繁多，不像分类问题，类别较固定，所以使用AdaBoost算法做回归问题时不能单单的用分类问题的AdaBoost 算法，其重点在于如何更新样本权重及分类器权重，参考资料有如下一种思路：

首先聊聊误差率问题，对于第m个若学习器，计算它在训练集上的最大误差：
$E_m=max|y_i - G_m(x_i)|$
为什么不取全体样本误差总值？
计算每个样本的相对误差：
$e_{mi}=\frac{|y_i - G_m(x_I)|}{E_m}$

最低0.47元/天解锁文章

22 条评论

Shaot_22 2023.11.04
同问这个权重计算和原理正好相反呀

已读不回VV 2022.02.18
你好，不明白为什么回归任务中误差小的对应弱学习器的权重也小，这与分类任务正好相反。这是为什么呢？请问能指点一番吗？
- Shaot_22回复已读不回VV 2023.11.04
  请问解决了吗[face]emoji:054.png[/face]

灵之来兮蔽日 2021.05.11
g(x)是指aG(x)还是G（X）

灵之来兮蔽日 2021.05.06
请问，样本权重之和一定为1吗

lamanbs 2021.04.26
你好请问遇没遇到弱预测器的效果比较强预测器效果好的现象
- 予亭回复lamanbs 2021.07.10
  说实话，看样本，都是面向数据选择模型，有可能会有弱预测器比较强的

xixixi66666 2021.04.19
请问计算训练集最大误差哪里的疑问解决了吗为什么是最大误差而不是总误差或者平均误差呢
- 予亭回复xixixi66666 2021.04.20
  这个问题没去了解了，我找个时间再去追究一下，有答案的话，更新博客，也欢迎你留言告知你的理解

BeaNewer 2021.03.22
并不是相同的分类器，可以看我的博客

灵之来兮蔽日 2020.11.29
博主，采用加权平均法，不需要再除以权重系数之和吗？

TacoTuesday 2020.04.16
博主，更新样本权重之后再次训练，样本权重的体现是指训练集抽样时按权重抽样吗？
- baozideya回复TacoTuesday 2021.11.14
  同问，不同的样本权重在训练样本点中起了什么样的作用点呢？
- weixin_51108932回复TacoTuesday 2021.07.20
  您好，我也有这个问题，请问您解决了吗，就是怎么把更新后的权重和原始数据集结合从而得到新的训练数据集的，谢谢！
- weixin_44170680回复xiaotian127 2020.12.18
  博主您好，请问关于Adaboost算法，每次迭代的时候是如何调整样本的呢。我的意思是这个算法相当于加权集成多个模型，那么每个模型就需要保持一定的差异性。请问在该算法中是怎么保持每个模型的差异性的呢？是通过每次训练时训练样本不一样吗？
- xiaotian127回复TacoTuesday 2020.09.26
  不是吧，应该是每个样本前面的所乘的那个系数