GBDT知识整理

最新推荐文章于 2022-10-25 20:53:13 发布

原创

最新推荐文章于 2022-10-25 20:53:13 发布 · 423 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #算法

GBDT（Gradient Boosting Decision Tree）是一种强大的机器学习算法，结合了Boosting思想和决策树的优势。本文详细介绍了GBDT的原理，包括Boosting、Gradient Boosting Model、Gradient Boosting Decision Tree，以及损失函数和与Adaboost的对比。通过对梯度的计算和决策树的使用，GBDT能有效地处理非线性问题。

GBDT算法(Gradient Boosting Decision Tree)，由于其出色的非线性拟合能力，被广泛应用在各种回归，分类的机器学习问题中。

除了能在日常工作中调用该算法取得好的结果之外，我们更需要深入理解这个算法的原理，以及其中涉及到的概念。

名词拆解

Boosting

GBDT中Gradient Boosting和Decision Tree是两个独立的概念。Boosting意思是把多个弱分类器组合起来形成一个强分类器。因此这不是某个算法，而一种理念。而和这个理念对应的是直接训练一次性构造一个强分类器，例如SVM，LR等等。

通常通过相加来组合分类器，形式如下：

F m (x) = f 0 + α 1 f 1 (x) + α 2 f 2 (x) + \dots \dots + α m f m (x) (1)

$F_m(x)=f_0+\alpha_1f_1(x)+\alpha_2f_2(x)+……+\alpha_mf_m(x) \qquad (1)$
其中x表示输入的特征，

Fm $F_m$ 表示最终得到的分类器，

f1,f2,……,fm $f_1,f_2,……,f_m$ 分别表示m个弱分类器，

f0 $f_0$ 是一个常数，

α1,α2,……,αm $\alpha_1,\alpha_2,……,\alpha_m$ 分别表示每个弱分类器对应的权重。

Gradient Boosting Model

Gradient Boosting Model，以下简称GBM。这是一种构造弱分类的方法。同样地，这不是某个具体的算法，仍然是只是一个理念。

先看一个典型的优化问题：

f i n d x ̂ = a r g m i n x f (x)

$find\ \hat{x} = arg\ \underset{x}{min}f(x)$
针对这种优化问题，最常用的解决方法是steepest descent(gradient descent)，算法逻辑如下：

1.给定一个起始点 $x_0$
2.对i=1，2，……K分别做如下迭代：
- a) $x_i = x_{i-1}+\gamma_{i-1}*g_{i-1}$ ，这里 $g_{i-1}=-\frac{\partial f}{\partial x}\mid_{x=x_{i-1}}$ 表示 $f$ 在 $x_{i-1}$ 点的梯度
3.直到 $|g_{i-1}|$ 足够小，或者是 $|x_i-x_{i-1}|$ 足够小

以上迭代过程可以这么理解：整个寻优的过程就是个小步快跑的过程，每跑一小步，都往函数当前下降最快的那个方向走一点。

这样寻优得到的结果可以表示成加和形式，即

x k = x 0 + γ 1 g 1 + γ 2 g 2 + \dots \dots + γ k g k

$x_k = x_0+\gamma_1g_1+\gamma_2g_2+……+\gamma_kg_k$
这个等式的形式和前面Eq.(1)弱分类器组合成强分类器

Fm $F_m$ 如出一辙，Gradient Boosting就是由此启发而来。构造

Fm $F_m$ 本就是一个寻找最优的过程，只不过我们寻找的不是一个最优点，而是一个最优的函数。优化的目标通常都是通过一个损失函数来定义，即

f i n d F m = a r g m i n F L (F) = a r g m i n F \sum i = 0 N L o s s (F (x i)

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。