xgboost的优点与GBDT对比

最新推荐文章于 2025-05-27 16:36:02 发布

hfzd24

最新推荐文章于 2025-05-27 16:36:02 发布

阅读量6.8k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： kaggle

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/hfzd24/article/details/76889428

本文对比了XGBoost和GBDT的差异，指出XGBoost支持线性模型，优化了损失函数并引入正则项，具备防止过拟合的策略如学习速率和列抽样。它还有独特的分裂点查找算法、对缺失值的处理能力、内置交叉验证、并行化处理以及允许自定义优化目标和评估标准，提供了更高的灵活性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

说明一下：这部分内容参考了知乎上的一个问答—机器学习算法中GBDT和XGBOOST的区别有哪些？，答主是wepon大神，根据他的总结我自己做了一理解和补充。

1.传统GBDT以CART作为基分类器，xgboost还支持线性分类器，这个时候xgboost相当于带L1和L2正则化项的逻辑斯蒂回归（分类问题）或者线性回归（回归问题）。 —可以通过booster [default=gbtree]设置参数:gbtree: tree-based models/gblinear: linear models

2.传统GBDT在优化时只用到一阶导数信息，xgboost则对代价函数进行了二阶泰勒展开，同时用到了一阶和二阶导数。顺便提一下，xgboost工具支持自定义代价函数，只要函数可一阶和二阶求导。 —对损失函数做了改进（泰勒展开，一阶信息g和二阶信息h,上一章节有做介绍）

3.xgboost在代价函数里加入了正则项，用于控制模型的复杂度。正则项里包含了树的叶子节点个数、每个叶子节点上输出的score的L2模的平方和。从Bias-variance tradeoff角度来讲，正则项降低了

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄9年

10
原创

21
点赞

67
收藏

15
粉丝

关注

私信

热门文章

分类专栏

kaggle 4篇
CNN 2篇
c++ 4篇
c
天池
机器学习 8篇
深度学习 2篇
NLP 1篇

展开全部收起

上一篇：: c++第三涨复习

下一篇：: xgboost中自定义损失函数的使用方法

最新评论

xgboost中自定义损失函数的使用方法
wbzhang233: 楼主，请问watchlist是什么意思呀？里面的xgb_train和xgb_test是什么意思
kaggle干货
微电子学与固体电子学-俞驰: "Public LB上面的效果并非是在真实未知数据上面的效果，不能可靠地反映模型的效果。划分 Public LB 和 Private LB 这样的设置，也在提醒参赛者，我们建模的目标是要获得一个在未知数据上表现良好的模型，而并非仅仅是在已知数据上效果好。"这个理解不对.
LSTM原理分析
KING_No_1 回复 FionaVivan: https://blog.youkuaiyun.com/shincling/article/details/49362161
LSTM原理分析
FionaVivan: 请问此博出处在哪？
xgboost中自定义损失函数的使用方法
vincent_93: 楼主，你的最后一个函数：def evalmape(preds, dtrain)。如果gaps有的维度为0，难道在除的时候不会报错吗？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。