KS和IV的区分比较

本文深入探讨了KS和IV两种统计指标的异同,包括它们的计算方法、用法、分箱影响以及数值调整时的变化。KS主要评估模型区分能力,而IV更侧重于变量区分。分箱数量增加,两者数值通常上升,但KS波动较大,IV相对稳定。在保持整体好坏比率不变的情况下,调整区间内的好坏比例会改变IV值,但不影响KS值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

KS和IV近期都有较多接触,为深入了解两个指标,个人分析了两者的异同:

总体比较

异同KSIV
计算

两者都需要用到分组中好坏样本数量与总体好坏样本数量的比值。

KS计算需要的是好坏比率的累计值之差,

IV用到的是同一分组好坏比率比值的对数。

用法

两者都可以衡量变量的区分能力。

IV一般使用在变量的区分能力上。

KS一般用于模型的区分能力上。

分箱影响

两者的数值都收到分箱数量的影响

IV:具有分箱数量越多IV值越大的趋势。

KS:具有分箱数量越多IV值越大的趋势,但波动较大。

其他        

KS:在保证整体好坏比率不变情况,最佳KS前或后改变区间好坏比,不会影响KS值。

IV:在保证整体好坏比率不变情况下,最佳KS前或后改变区间好坏比,会影响IV值。

在保证整体好坏比率不变情况下,最佳分组前后都改变区间好坏比,会影响IV和KS值。

关于分箱数量对KS和IV的影响

分箱数量增加,KS和IV都有着增加的趋势,在前期比较明显,但是KS的波动较大,IV波动较小。

关于数值调整对KS和IV的影响 

1.这是按照一定分组和好坏设定下的IV和KS值。

2.修改第1组和第2组的好坏比例,第1组坏样本减少10个,第2组增加10个。KS的值没有变化,但是IV的数值却有所增加。

3.修改第1组和第8组好坏分布,第1组坏样本减少10个,第8组增加10个。kS和IV都发生了变化。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值