GBDT 原理推导+sklearn参数解释

本文详细介绍了GBDT(梯度提升决策树)算法,从Adaboost算法出发,探讨前向分步算法,展示了二分类和回归问题的解决方式。接着,文章深入讲解了GBDT的优缺点和正则化方法。此外,重点阐述了在sklearn中GBDT的参数设置,包括boosting和决策树参数,如n_estimators、learning_rate、subsample等,帮助理解并优化模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

adaboost算法

adaboost是boosting方法中的一种,主要思想是提高分类错误的样本的权值,降低分类正确样本的权值。这样做的方法存在两个问题

第一,如何更新样本权值
第二,如何组合成一个强分类器

带着这些问题来看算法的具体步骤:
输入:训练集数据;以及弱学习算法
输出:强分类器
1.初始化训练数据的权值
在这里设为1/N
2.遍历1-m
a.使用具有权值分布的训练数据训练分类器
b.计算该分类器的分类误差
Em
c.计算该分类器的系数(权重)
在这里插入图片描述
在这个系数的构建就可以看出其分类器的系数与分类正确率正相关。分类越正确那么该分类器的权重越高。
d.更新数据集的权重
在这里插入图片描述
更新w的过程就是,构造一个函数使得分类错误的样本权重更大并且使得权重标准化
3.弱分类器线性组合成强分类器
在这里插入图片描述

前向分步算法

考虑一个加法模型有:
在这里插入图片描述
那么给定一个损失函数L()
最小化损失函数
在这里插入图片描述
由于学习的是加法模型
可以每次只学习一个基函数以及其系数,慢慢减少误差。那么每步只需要对一个基函数进行优化,从而减少大量的计算:
在这里插入图片描述
说完总体思路来看看其具体算法:
输入:训练集,损失函数,基函数集
输出:加法模型
1.初始化加法模型等于0
2.遍历1-M
a.极小化损失函数在这里插入图片描述
得到参数beta和yita
b

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值