gbdt python_GBDT算法之Python调参

最新推荐文章于 2025-05-06 03:02:05 发布

weixin_39704246

最新推荐文章于 2025-05-06 03:02:05 发布

阅读量881

点赞数 1

文章标签： gbdt python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39704246/article/details/111971767

版权

本文详细介绍了梯度提升模型（GBDT）在分类和回归任务中的关键参数设置，包括criterion、init、learning_rate、loss、subsample和n_estimators。通过实例阐述了不同参数的作用，并对比了分类与回归模型的异同。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

梯度提升模型，既可以做分类，在scikit-learn中使用GradientBoostingClassifier类；也可以用于回归，使用GradientBoostingRegressor类。下面我们就来分别介绍这两个部分。

分类

GBDT的分类模型如下：

如上图所示，看上去有很多参数，实际上我们很多都已经见过。下面来介绍主要的几个参数：

1.criterion参数

指特征选择的标准，我们就选择默认即可。

2.init参数

指是否用该参数提供的弱分类器来进行预测，默认为None，即使用原始样本集来进行预测。

3.learning_rate

学习率，指弱分类器的系数。

4.loss

指损失函数的类型，默认为deviance，即使用对数似然函数；也可以选择exponential，即指数损失函数。

5.subsample

指采样的比例，在0-1之间，默认为1，即不采样，使用全部样本；小于1，意味着只有一部分参与了模型的拟合。

6.n_estimators

指弱分类器的个数，默认为100.

回归

接下来，看看GBDT回归模型的参数：

可以看到，回归模型的参数大部分与分类相同，只有损失函数采用的不同。下面我们就来介绍loss参数。

回归模型的损失函数主要有4种，默认为ls(标准差函数)。还有三种分别是lad(绝对损失函数)、huber和quantile(分位损失函数)。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。