集成学习算法梳理——GBDT

最新推荐文章于 2025-06-11 10:06:53 发布

原创

最新推荐文章于 2025-06-11 10:06:53 发布 · 1.5k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

GBDT是一种梯度提升决策树算法，适用于分类和回归问题。它通过不断迭代学习残差来提高预测准确性。损失函数可以是平方误差或对数似然损失，而正则化手段包括早停、子采样和弱分类器剪枝。虽然GBDT对异常值具有鲁棒性，但其boosting特性限制了并行加速。在Python中，可以使用sklearn库的GradientBoostingClassifier()进行实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

GBDT概述
前向分步算法
损失函数
- 负梯度拟合
- 损失函数
分类算法
正则化
优缺点
- 优点
- 缺点
sklearn API
- sklearn.ensemble.GradientBoostingClassifier()
应用场景
参考资料

GBDT概述

GBDT(Gradient Boosting Decision Tree, 梯度提升决策树)不仅可以用于分类问题，还可以用于回归问题，GBDT的核心思想在于，每一棵树学习的是之前所有树的整体预测和标签的误差，这里称之为残差. 即给定A的真实年龄为18，第一棵树预测的年龄是12岁，那么第二棵树预测的目标应当是6岁(18-12)…

GBDT中的所有的树都是CART回归树，而不是分类树.

前向分步算法

对于加法模型
$f(x)=\sum_{m=1}^M\beta_mb(x;\gamma_m)$
其中 $b(x;\gamma_m)$ 为基函数， $\gamma_m$ 为基函数的参数， $\beta_m$ 为基函数的系数.
在给定训练数据及损失函数的条件下，学习加法模型 $f (x)$ 成为经验风险极小化即损失函数极小化问题.
$\min_{\beta_m,\gamma_m}\sum_{i=1}^NL\Big(y_i,\sum_{m=1}^M\beta_mb(x_i;\gamma_m))$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。