KS和IV近期都有较多接触,为深入了解两个指标,个人分析了两者的异同:
总体比较
| 异同 | KS | IV |
| 计算 |
两者都需要用到分组中好坏样本数量与总体好坏样本数量的比值。 KS计算需要的是好坏比率的累计值之差, IV用到的是同一分组好坏比率比值的对数。 | |
| 用法 |
两者都可以衡量变量的区分能力。 IV一般使用在变量的区分能力上。 KS一般用于模型的区分能力上。 | |
| 分箱影响 |
两者的数值都收到分箱数量的影响 IV:具有分箱数量越多IV值越大的趋势。 KS:具有分箱数量越多IV值越大的趋势,但波动较大。 | |
| 其他 |
KS:在保证整体好坏比率不变情况,最佳KS前或后改变区间好坏比,不会影响KS值。 IV:在保证整体好坏比率不变情况下,最佳KS前或后改变区间好坏比,会影响IV值。 在保证整体好坏比率不变情况下,最佳分组前后都改变区间好坏比,会影响IV和KS值。 | |
关于分箱数量对KS和IV的影响
分箱数量增加,KS和IV都有着增加的趋势,在前期比较明显,但是KS的波动较大,IV波动较小。

关于数值调整对KS和IV的影响
1.这是按照一定分组和好坏设定下的IV和KS值。

2.修改第1组和第2组的好坏比例,第1组坏样本减少10个,第2组增加10个。KS的值没有变化,但是IV的数值却有所增加。

3.修改第1组和第8组好坏分布,第1组坏样本减少10个,第8组增加10个。kS和IV都发生了变化。

本文深入探讨了KS和IV两种统计指标的异同,包括它们的计算方法、用法、分箱影响以及数值调整时的变化。KS主要评估模型区分能力,而IV更侧重于变量区分。分箱数量增加,两者数值通常上升,但KS波动较大,IV相对稳定。在保持整体好坏比率不变的情况下,调整区间内的好坏比例会改变IV值,但不影响KS值。
160

被折叠的 条评论
为什么被折叠?



