1. 核心思想
XGBoost(Extreme Gradient Boosting)是基于梯度提升框架(Gradient Boosting)的改进算法,通过集成多棵弱决策树(通常是CART树)并逐步优化模型,最终形成一个强学习器。其核心思想是:
-
加法模型:通过迭代地添加新树来修正前一棵树的残差,逐步逼近目标函数的最优解。
-
梯度提升:利用损失函数的负梯度方向(近似残差)作为新树的拟合目标,指导每一轮迭代的方向。
-
正则化优化:在目标函数中引入正则化项(L1/L2),控制模型复杂度,防止过拟合。
2. 技术细节
-

-
并行化与加速:
-
特征预排序(Pre-sorted)和分块存储(Block),支持多线程并行计算。
-
近似算法(如直方图分桶)加速分裂点搜索。
-
3. 适合解决的问题
XGBoost在以下场景中表现突出:
-
结构化/表格数据:

最低0.47元/天 解锁文章
449

被折叠的 条评论
为什么被折叠?



