XGboost的整理

胡萝拔贝贝

已于 2024-03-26 15:50:46 修改

阅读量775

点赞数 11

文章标签：算法机器学习人工智能

于 2024-03-05 18:02:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42209537/article/details/136476107

版权

本文介绍了XGBoost，一种高效的GBDT实现，着重于算法改进，如加入正则项控制模型复杂度，利用泰勒展开加速训练，并讨论了特征选择、树剪枝等关键步骤。同时涵盖了多输出支持和与GBDT的区别，以及如何使用XGBoost库进行模型训练和评估。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

XGboost（extreme gradient boosting）:高效实现了GBDT算法并进行了算法和工程上的许多改进。

XGboost的思路：

目标：建立k个回归树，使得树群的预测尽量接近真实值（准确率）而且有尽量大的泛化能力。

目标函数： $L\left ( \phi \right )=\sum_{i}^{}l\left ( \hat{y_{i}}-y_{i} \right )+\sum_{k}^{}\Omega \left ( f_{k} \right )$

i表示第i个样本， $l\left ( \hat{y_{i}}-y_{i} \right )$ 表示第i个样本的预测误差，误差越小越好， $\sum_{k}^{}\Omega \left ( f_{k} \right )$ 表示树的复杂度的函数，越小复杂度越低，泛化能力越强

$\Omega \left ( f_{t} \right )=\gamma T+\frac{1}{2}\lambda \sum_{j=1}^{T}\omega _{j}^{2}$

T：叶子的个数

$\omega _{j}^{2}$ ：w的L2模平方

目标要求预测尽量小，叶子节点尽量少，节点数值尽量不极端，回归树的参数（1）选取哪个特征分裂节点（2）节点的预测值。间接解决这两个参数的方法：贪心策略+最优化（二次最优化）

（1）选取哪个特征分裂节点：最简单的是枚举，选择loss function效果最好的那个

（2）确立节点的w以及最小的loss function，采用二次函数的求最值

步骤：选择一个feature分裂，计算loss function最小值，然后再选一个feature分列，又得到一个loss function最小值，枚举完成后，找一个效果最好的，把树分裂，在分裂的时候，每次节点分裂，loss function被影响的只有这个节点的样本，因而每次分裂，计算分裂的增益只需要关注打算分裂的那个节点的样本。接下来，继续分裂，按照上述方法，形成一棵树，再形成一棵树，每次在上一次的预测基础上取最优进一步分裂/建树。

停止条件：

①当引入的分裂带来的增益小于一个阈值的时候，可以剪掉这个分裂，所以并不是每一次分裂lossfunction整体都会增加的，有点预剪枝的意思，阈值参数为 $\gamma$ 正则项里叶子节点数T的系数。

②当数达到最大深度时则停止建立决策树，设置一个超参数max_depth，树太深很容易出现过拟合。

③当样本权重和小于设定阈值时则停止建树，一个叶子节点样本太少时，终止，避免过拟合。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。