树模型系列之CatBoost

最新推荐文章于 2024-11-14 15:52:01 发布

召唤师的峡谷

最新推荐文章于 2024-11-14 15:52:01 发布

阅读量886

点赞数

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_37850187/article/details/105794696

版权

机器学习算法专栏收录该内容

7 篇文章 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

CatBoost是一种基于GBDT的算法，强调处理类别型特征和优化梯度偏差。其特性包括无需调参的高模型质量、GPU加速、预测效率等。文章探讨了类别型变量处理、梯度偏差、预测偏移、有序提升和GPU加速等优化策略，并概述了应用场景和优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

树模型系列之CatBoost

树模型系列之CatBoost

CatBoost是在GBDT算法框架下的一种改进实现，是一种基于对称决策树（oblivious trees）算法的参数少、支持类别型变量和高准确性的GBDT框架，主要说解决的痛点是高效合理地处理类别型特征，这个从它的名字就可以看得出来，CatBoost是由catgorical和boost组成，另外是处理梯度偏差(Gradient bias) 以及 预测偏移(Prediction shift) 问题，提高算法的准确性和泛化能力。

CatBoost主要有以下五个特性：

无需调参即可获得较高的模型质量，采用默认参数就可以获得非常好的结果，减少在调参上面花的时间
支持类别型变量，无需对非数值型特征进行预处理
快速、可扩展的GPU版本，可以用基于GPU的梯度提升算法实现来训练你的模型，支持多卡并行
提高准确性，提出一种全新的梯度提升机制来构建模型以减少过拟合
快速预测，即便应对延时非常苛刻的任务也能够快速高效部署模型

性能优化策略

Categorical featur

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

召唤师的峡谷 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。