19、不平衡分类的成本敏感模型调优

不平衡分类的成本敏感模型调优

在不平衡分类问题中,传统的机器学习算法往往表现不佳。本文将介绍如何通过网格搜索来调整加权逻辑回归和加权决策树的类别权重,以提高模型在不平衡数据集上的性能。

1. 网格搜索加权逻辑回归

在不平衡分类中,使用训练数据的逆比例作为类别权重只是一种启发式方法。可能通过不同的类别权重配置可以获得更好的性能,这也取决于用于评估模型的性能指标。下面我们将对加权逻辑回归的不同类别权重进行网格搜索,以找到具有最佳 ROC AUC 分数的配置。

1.1 定义网格搜索的类别权重

我们将尝试以下类别 0 和类别 1 的权重配置:
- 类别 0: 100,类别 1: 1
- 类别 0: 10,类别 1: 1
- 类别 0: 1,类别 1: 1
- 类别 0: 1,类别 1: 10
- 类别 0: 1,类别 1: 100

这些权重可以定义为 GridSearchCV 类的网格搜索参数:

# define grid
balance = [{0:100,1:1}, {0:10,1:1}, {0:1,1:1}, {0:1,1:10}, {0:1,1:100}]
param_grid = dict(class_weight=balance)
1.2 执行网格搜索

使用重复交叉验证对这些参数进行网格搜索,并使用 ROC AUC 评估模型性能:

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值