scorecardpy 库woebin 函数

核心功能

woebin 是信用评分卡开发中的核心工具,主要用于:

  1. 对数值型、分类型特征进行最优分箱(将特征划分为若干区间);
  2. 计算每个分箱的 WOE(证据权重) 和 IV(信息值)
  3. 支持自定义分箱规则,兼顾算法最优性和业务可解释性。

参数详解

基础参数
  • dt: pandas DataFrame,包含特征(x)和目标变量(y)的数据集。
  • y:字符串,目标变量的列名(如 "违约"、"坏账"),需为二元变量(通常 0/1 或 "好"/"坏")。
  • x:列表,需要分箱的特征名称列表。默认 None,表示对所有非目标变量分箱。
  • var_skip:列表,需要跳过分箱的特征名称,默认 None
分箱规则参数
  • breaks_list:字典,自定义分箱断点。例如:
    breaks_list = {'age': [20, 30, 40], 'income': [5000, 10000]}
    
    表示将 age 分为 [20,30)、[30,40) 等区间。
  • special_values:字典,指定需要单独作为分箱的特殊值(如缺失值、异常值)。例如:
    special_values = {'income': [-1, 'missing']}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值