23、不平衡分类中的加权XGBoost与概率阈值调整

linux6sysadmin

于 2025-08-28 12:01:25 发布

阅读量64

点赞数

CC 4.0 BY-SA版权

分类专栏：破解不平衡分类难题文章标签： XGBoost 不平衡分类概率阈值调整

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/linux6sysadmin/article/details/151574471

破解不平衡分类难题专栏收录该内容

37 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

不平衡分类中的加权XGBoost与概率阈值调整

1. 加权XGBoost在不平衡分类中的应用

在不平衡分类问题中，加权XGBoost是一种有效的方法。通过对正类进行加权，可以调整XGBoost训练算法，使其在训练过程中更加关注少数类样本。

在对正类权重进行网格搜索时，发现 scale_pos_weight=99 取得了最佳的平均ROC分数，这与一般的启发式配置相匹配。几乎所有大于默认值1的权重都有更好的平均ROC AUC，甚至激进的权重值1000也是如此。有趣的是，权重值99的表现比100更好。以下是不同权重值对应的ROC AUC分数：
| scale_pos_weight | 平均ROC AUC分数 |
| ---- | ---- |
| 1 | 0.957239 (0.031619) |
| 10 | 0.958219 (0.027315) |
| 25 | 0.958278 (0.027438) |
| 50 | 0.959199 (0.026171) |
| 75 | 0.959204 (0.025842) |
| 99 | 0.959901 (0.025499) |
| 100 | 0.959141 (0.025409) |
| 1000 | 0.958761 (0.024757) |

可以看出，选择合适的正类权重对于提高模型性能至关重要。

2. 概率阈值移动在不平衡分类中的作用

分类预测建模通常涉及预测类别标签，但许多机器学习算法能够预测类别成员的概率或得分。在将这些概率或得分映射到明确的类别标签

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。