GBDT的一些知识点

Karate_Y

于 2019-12-06 19:29:24 发布

阅读量228

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_39846523/article/details/103428481

机器学习专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了Bagging和Boosting两种集成算法的特点，特别是GradientBoosting算法的工作原理，以及其与梯度下降算法的异同。同时，文章还详细分析了GBDT算法的优点与局限性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Bagging和Boosting两大集成算法。相比与Bagging中各个弱分类器可以独立地进行训练，Boosting中的弱分类器需要一次生成。在每一轮迭代中，基于已生成的弱分类器集合(即当前模型)的预测结果，新的弱分类器会重点关注那些还没有被正确预测的样本。
Gradient Boosting是Boosting中的一大类算法，其基本思想是根据当前模型损失函数的负梯度信息来训练新加入的弱分类器，然后将训练好的弱分类器以累加的形式结合到现有模型中。在每一轮迭代中，首先计算出当前模型在所有样本上的负梯度，然后以该值为目标训练一个新的弱分类器进行拟合并计算出该分类器的权重，最终实现对模型的更新。

梯度提升和梯度下降的区别和联系

通过梯度提升和梯度下降算法的对比情况。可以发现，两者都是在每一轮迭代中利用损失函数相对与模型的负梯度方向的信息来对当前模型进行更新，只不过在梯度下降中，模型是以参数化的形式表示。从而模型的更新等价与参数的更新，而在梯度提升中，模型并不需要进行参数化表示，而是直接定义在函数空间中，从而大大扩展了可以使用的模型种类。

GBDT的优点和局限性有哪些¶

优点¶

局限性¶

预测阶段的计算速度快，树与树之间可以并行化计算。
在分布稠密的数据集上，泛化能力和表达能力都很好，这使得GBDT在Kaggle的众多竞赛中，经常名列前茅。
采用决策树作为弱分类器使得GBDT模型有着较好的可解释性和鲁棒性，能够自动发现特征间的高阶关系，并且也不需要对数据进行特殊的预处理如归一化等。
GBDT在高维稀疏的数据集上，表现不如支持向量机或者神经网络。
GBDT在处理文本分类特征问题上，相对于其他模型的优势不如它在处理数值特征时明显。
训练过程需要串行化，只能在决策树内部采取一些局部并行的手段提高训练速度。

博客等级

码龄8年

67
原创

10
点赞

54
收藏

5
粉丝

关注

私信

热门文章

分类专栏

C 1篇
计算机网络 2篇
排序算法 11篇
OpenCV 1篇
mysql 1篇
C++ 33篇
计算机操作系统 2篇
算法 12篇
机器学习 4篇
二叉树的遍历 3篇
HTTP 1篇
Linux 2篇
查找 1篇

展开全部收起

上一篇：: 面试考点-----二叉树的中序遍历(递归&迭代)

下一篇：: XGBoost与GBDT的联系和区别有哪些？

最新评论

使用C++实现生产者消费者模式
qq_42466012: 感谢楼主回复。最近我也研究了一些，如果只有一个生产者一个消费者，那么一个cv是没问题的；但如果多生产者多消费者，会存在效率问题和逻辑不清晰的问题，因为一个cv的话，notify之后不确定唤醒的是消费线程还是生产线程，如果在生产线程唤醒的还是生产线程，则会空跑一次造成CPU浪费，因为此时主要想唤醒消费线程。改用两个cv，分别用来唤醒生产者、消费者，指向明确，逻辑清晰，减少CPU资源浪费。
使用C++实现生产者消费者模式
Karate_Y: 关键在于是否是有界的阻塞队列。如果只有一个cv，通过只是用来判定队列是否为空，此时为无界队列(即理论上队列可以存放任意多的元素)。如果再加一个cv，用来判定队列中是否满了，此时为有界队列，当队列满时不再往其中添加元素
使用C++实现生产者消费者模式
qq_42466012: 博主好，在下有一事不明，还请博主指教：我见实现生产消费的方法，有用一个cv的有用两个cv的，请问区别在哪里，感觉好像一个就够的样子。。。
约瑟夫环迭代法
openallzzz: 为什么是%i
约瑟夫环迭代法
哒哒苏苏: 但是怎么理解？下面的解析还是有点没看明白

大家在看

KEEPALIVED

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。