xgboost处理二分类问题原理

最新推荐文章于 2025-07-07 19:18:00 发布

原创

最新推荐文章于 2025-07-07 19:18:00 发布 · 1.8w 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#xgboost #gbdt #二分类

博客探讨了xgboost在处理二分类问题时如何返回0到1之间的概率值，指出并非直接使用gini系数或均方差来决定树的分裂。博主解释了每个树的优化目标以及如何通过一阶和二阶导数决定分裂，最终通过logistic function将得分转换为概率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

博主最近为了准备校招猛看有关gbdt的算法细节，有一个百思不得其解的疑惑，就是xgboost在处理二分类问题时，返回的预测值是0~1之间的概率值，莫非和logistic function有关？

最终，我查阅了xgboost官网的介绍，得到了一些答案。在这里，具体原理我就不讲了，网上一大堆资料写烂了（具体原理请看这篇文章），我说几个容易忽视的地方。

1.叶子是以什么指标决定是否分裂的？

一开始，在网上看资料说xgboost用到的都是CART回归树，自然而言就以为，解决分类问题用到时gini系数，回归问题用的是均方差，实际根本不是这回事！

首先，我们的obj经过一系列化简得到

这里

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。