机器学习 --- GBDT提升算法（Gradient Boosting）

最新推荐文章于 2024-02-07 22:23:57 发布

原创

最新推荐文章于 2024-02-07 22:23:57 发布 · 884 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #算法

本文深入探讨了GBDT算法的原理，包括其背后的数学理论、梯度提升思想以及与Adaboost的区别。通过实例展示了GBDT在回归和分类任务中的应用，并比较了GBDT、Xgboost和LightGBM三种模型的性能。此外，还提供了基于Mnist数据集的代码实现，以及LightGBM在饭店流量预测中的实际案例。

Gradient Boosting

以梯度为优化目标，以提升将整个架构串在一起，用决策树当做模型细节中的每一个小部分

分类回归树（CART）

数据集： $\begin{Bmatrix} ((x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(m)},y^{(m)})) \end{Bmatrix}$

衡量标准：

$s^2 \cdot m= (y^{(1_{left})}-\bar{y}_{left})^2+...+(y^{(n_{left})}-\bar{y}_{left})^2+(y^{(1_{right})}-\bar{y}_{right})^2+...+(y^{(m-n_{left})}-\bar{y}_{right})^2$

Adaboost算法概述

原数据集：
在这里插入图片描述
第一次划分：

在第一次划分完成后，对于分类正确的数据降低权重，分类错误的值增加权重

第二次划分：
在这里插入图片描述
在第二次划分完成后，同样是对于分类正确的数据降低权重，分类错误的值增加权重

第三次划分：
在这里插入图片描述
在第三次划分完成后，同样是做权重调整工作

最终，对三次分类进行整合，不同的分类精度对应不同的 $\alpha$ 权重，将其加和得到最后结果
在这里插入图片描述

GB算法

优化的目标：
$\underset{f(x)}{arg min}E_{x,y}[L(y,f(x))]$

$L (y, f (x))$ 是一个损失函数， $f (x)$ 是一个模型，我们需要找到一个模型 $f (x)$ 使得损失函数最小

其实目标还是去找最合适的参数：
$\hat{\theta} =\underset{\theta }{arg min}E_{x,y}[L(y,f(x,\theta ))]$

结果依旧是需要迭代得出：
$\hat{\theta} = \sum_{i=1}^{M}\hat{\theta}_i$

梯度的思想

找到最合适的参数：
$(\rho _t,\theta _t)=\underset{\rho ,\theta }{argmin}E_{x,y}[L(y,\hat{f}(x )+\rho \cdot h(x,\theta))]$

残差的计算（负梯度）：
$r_{it}=-[\frac{\partial L(y,f(x_i))}{\partial f(x_i)}]_{f(x_i)=\hat{f}(x )}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。