GBDT(Gradient Boosting Decision Tree)

GBDT原理详解

最新推荐文章于 2025-04-19 10:23:23 发布

原创最新推荐文章于 2025-04-19 10:23:23 发布 · 439 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

15 篇文章

订阅专栏

本文深入探讨了GBDT(梯度提升决策树)的工作原理，包括其作为提升树模型的基础概念，以及如何通过前向分步模型来逐步逼近最优预测值。文章详细解释了在不同损失函数下的梯度提升策略，并提供了算法实现流程。

GBDT(Gradient Boosting Decision Tree)

1.提升树

提升树模型的基分类器为决策树，每次训练的结果影响下一次训练的决策树。我们这里只谈回归问题，训练的结果为M个决策树相加。对于二分类问题只需把AdaBoost算法的基分类器换为决策树。

用前向分步模型表示

f m (x) = f m - 1 (x) + T (x; θ m)

$f_m(x) = f_{m-1}(x) + T(x;\theta_m)$
其中

T (x i; θ m) = \sum j = 1 J c j I (x i \in R j)

$T(x_i;\theta_m) = \sum_{j=1}^J c_j I(x_i \in R_j)$

T(xi;θm) $T(x_i; \theta_m)$ 为回归决策树，它将特征空间分割J个区域，每个区域表示为

Rj $R_j$ ,每个区域设定一个值

cj $c_j$ ，当

xi∈Rj $x_i \in R_j$ 时决策树的输出为

cj $c_j$ 。

当使用平均方差损失函数时

L (y i, f m (x i)) = 1 2 (y i - f m - 1 (x i) - T (x i; θ m)) 2 = 1 2 (r m i - T (x i; θ m)) 2 = L (r m i, T (x i; θ m))

$\begin{eqnarray} L(y_i,f_m(x_i)) &&=\frac{1}{2} (y_i - f_{m-1}(x_i) - T(x_i;\theta_m))^2 \\ &&=\frac{1}{2}(r_{mi} - T(x_i; \theta_m))^2 \\ &&= L(r_{mi} ,T(x_i;\theta_m)) \end{eqnarray}$

rmi $r_{mi}$ 是当前模型

fm−1(x) $f_{m-1}(x)$ 的残差

yi−fm−1(xi) $y_i - f_{m-1}(x_i)$ 。因此我们可以用当前模型的残差去拟合下一颗决策树。

2.梯度提升

当损失函数不是平均方差时，用损失函数的负梯度近似去代替当前模型的残差

[- \partial L ( y i , f ( x ) ) \partial f ( x )] f (x) = f m - 1 (x)

$[-\frac{\partial L(y_i,f(x)) }{\partial f(x)}]_{f(x)=f_{m-1}(x)}$

算法：

初始化 $f_0(x) = \arg \min_{c} \sum_{i=1}^N L(y_i-c)$
对于 m= 1,2,.., M

a 对于 i = 1,.., N 计算

$r m i = [- \partial L ( y i , f ( x ) ) \partial f ( x )] f (x) = f m - 1 (x)$ $r_{mi}=[-\frac{\partial L(y_i,f(x)) }{\partial f(x)}]_{f(x)=f_{m-1}(x)}$
b 对 $r_m$ 拟合一颗回归树，得到第m颗树的叶结点区域 $R_{mj}$ ,j=1,2,..,J
c 对 j=1,2,,…J 计算

$c m j = arg min c \sum x i \in R m j L (y i, f m - 1 (x) + c)$ $c_{mj} = \arg \min_{c} \sum_{x_i \in R_mj} L(y_i, f_{m-1}(x) +c)$
d 更新 $f_m(x) = f_{m-1}(x) + \sum_{j=1}^j c_{mj} I(x \in R_{mj})$
得到提升数 $f_M(x)$ .

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。