XGBoost理论相关推导

最新推荐文章于 2024-11-04 21:39:07 发布

huangyi_906

最新推荐文章于 2024-11-04 21:39:07 发布

阅读量624

点赞数 1

分类专栏：机器学习算法总结文章标签： XGBoost 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Huangyi_906/article/details/76210474

版权

本文介绍了XGBoost的基础概念，通过对比与随机森林的差异，揭示了XGBoost如何通过优化损失函数和引入正则项来构建高效强分类器。XGBoost中的决策树构建基于残差，以此减少偏差，提升模型性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概论

弱分类器可以通过bagging和boosting转换成强分类器。随机森林是bagging的改进，通过有放回的随机采样，获得不同的样本数据，随机得到不同的决策树，各个决策树之间相互独立，通过投票选出最终结果。boosting是所有分类器加权求和预测最终结果，各个分类器相互不独立。

XGBoost推导

首先定义损失函数，常见的有均方误差和绝对值差：
这里写图片描述
XGBoost中，第i颗决策树依赖前i-1颗决策树加权求和而生成，表示为：。
再思考基本分类器：决策树。决策树的复杂程度可以用叶节点个数和叶节点权重来表示，为防止过拟合，引入惩罚系数γ和λ：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。