Gradient boosted decision tree

最新推荐文章于 2024-07-04 21:40:57 发布

SilenceHell

最新推荐文章于 2024-07-04 21:40:57 发布

阅读量361

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习技法学习笔记

本文链接：https://blog.youkuaiyun.com/Du_Shuang/article/details/83019680

机器学习技法学习笔记专栏收录该内容

9 篇文章

订阅专栏

本文深入探讨了Adaboost与Gradient Boosting两种机器学习算法。Adaboost通过调整错误样本权重来优化决策树，而Gradient Boosting则通过梯度下降方式提升模型性能。文章还介绍了Adaboost中权重计算的数学原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.Adboost decision tree
在这里插入图片描述

Gradient boosted decision 就是将Adaboost和decision Tree结合起来的算法。
在这里插入图片描述
Adaboost是根据前一步求出的g的错误率来提高错误数据在下一笔训练数据里面的权重来不断训练处新g的。
但是decision tree没有权重的概念我们该怎么办呢？我们的方法是根据权重来对数据进行取样，比如错误率本来是10，那么我们就把错误数据的采样概率提高10倍，然后用采样的新数据来训练新的决策树。
在这里插入图片描述
但是如果我们总是训练出一个完全的决策树，那么决策树的错误率总是0，那么其在最终结果中的权重都将是无穷大，所以这时不行的，我们采取的方法是：对决策树进行剪枝或者限定树的高度，不训练出一个完全的决策树。
比如说，限制高度为1：
在这里插入图片描述
当限制高度为1时，我们不需要做sampling，而是直接将权重带进去，因为一层的决策树就是一个简单的二分问题。