集成学习3—— XGBoost&LightGBM

最新推荐文章于 2024-08-01 18:01:28 发布

读书不觉已春深！

最新推荐文章于 2024-08-01 18:01:28 发布

阅读量262

点赞数

文章标签：集成学习机器学习人工智能

本文链接：https://blog.youkuaiyun.com/m0_64375823/article/details/122138816

版权

本文深入探讨了XGBoost和LightGBM两种集成学习算法，详细介绍了它们的原理、优化策略及代码实现，包括XGBoost的精确贪心分裂算法与基于直方图的近似算法，以及LightGBM的优化特点和参数调整。通过理解这些内容，有助于提升机器学习模型的性能和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、XGBoost

XGBoost官方文档

1.1 XGBoost原理及构建

XGBoost本质上还是一个GBDT，是一个优化的分布式梯度增强库，旨在实现高效，灵活和便携。Xgboost以CART决策树为子模型，通过Gradient Tree Boosting实现多棵CART树的集成学习，得到最终模型。

XGBoost的最终模型构建：
引用陈天奇的论文，我们的数据为： $\mathcal{D}=\left\{\left(\mathbf{x}_{i}, y_{i}\right)\right\}\left(|\mathcal{D}|=n, \mathbf{x}_{i} \in \mathbb{R}^{m}, y_{i} \in \mathbb{R}\right)$

(1) 构造目标函数：
假设有K棵树，则第i个样本的输出为 $\hat{y}_{i}=\phi\left(\mathrm{x}_{i}\right)=\sum_{k=1}^{K} f_{k}\left(\mathrm{x}_{i}\right), \quad f_{k} \in \mathcal{F}$ ，其中， $\mathcal{F}=\left\{f(\mathbf{x})=w_{q(\mathbf{x})}\right\}\left(q: \mathbb{R}^{m} \rightarrow T, w \in \mathbb{R}^{T}\right)$
因此，目标函数的构建为：
$\mathcal{L}(\phi)=\sum_{i} l\left(\hat{y}_{i}, y_{i}\right)+\sum_{k} \Omega\left(f_{k}\right)$
其中， $\sum_{i} l\left(\hat{y}_{i}, y_{i}\right)$ 为loss function， $\sum_{k} \Omega\left(f_{k}\right)$ 为正则化项。

(2) 叠加式的训练(Additive Training)：

给定样本 $x_i$ ， $\hat{y}_i^{(0)} = 0$ (初始预测)， $\hat{y}_i^{(1)} = \hat{y}_i^{(0)} + f_1(x_i)$ ， $\hat{y}_i^{(2)} = \hat{y}_i^{(0)} + f_1(x_i) + f_2(x_i) = \hat{y}_i^{(1)} + f_2(x_i)$ …以此类推，可以得到： $\hat{y}_i^{(K)} = \hat{y}_i^{(K-1)} + f_K(x_i)$ 其中， $\hat{y}_i^{(K-1)}$ 为前K-1棵树的预测结果， $f_K(x_i)$ 为第K棵树的预测结果。
因此，目标函数可以分解为：
$\mathcal{L}^{(K)}=\sum_{i=1}^{n} l\left(y_{i}, \hat{y}_{i}^{(K-1)}+f_{K}\left(\mathrm{x}_{i}\right)\right)+\sum_{k} \Omega\left(f_{k}\right)$
由于正则化项也可以分解为前K-1棵树的复杂度加第K棵树的复杂度，因此： $\mathcal{L}^{(K)}=\sum_{i=1}^{n} l\left(y_{i}, \hat{y}_{i}^{(K-1)}+f_{K}\left(\mathrm{x}_{i}\right)\right)+\sum_{k=1} ^{K-1}\Omega\left(f_{k}\right)+\Omega\left(f_{K}\right)$ 由于

最低0.47元/天解锁文章