风控算法知识——浅谈信息熵与IV值应用介绍

本文介绍了信息熵的概念及其计算方式,解释了信息熵如何衡量事件的不确定性。同时,文章深入探讨了IV值的计算方法及在风控领域的应用,强调IV值能够评估变量的预测能力。

此前我们讨论了WOE值以及应用场景,而提到了WOE值,就不得不再提出IV值,IV值公式的形成来源于信息熵,公式形式是类似的,只是具体的计算不一样。传送门:《风控算法知识——WOE值的深度理解与应用》

而什么是信息熵呢?香农(Shannon)早在1948年在他著名的《通信的数学原理》论文中指出:“信息是用来消除随机不确定性的东西”并提出信息熵的概念。熵越大表示信息的无序化程度越高,相对应的信息效用越低。

在这里插入图片描述

而信息熵是消除不确定性所需信息量的度量,即未知事件可能含有的信息量。我们用信息熵来描述一个事件混乱程度的大小(一个事件我们一定知道结果,那么这个事件的混乱程度就是0;而相反一个事件充满随机性,我们猜不到或者很难猜到结果,那么他的混乱度就很大)。

例如,小伙伴告诉我“意大利进欧洲杯了!”我就觉得“哦~我知道了。”意大利身为传统欧洲劲旅,几乎从欧洲杯开办以来就一直进入欧洲杯了,也就是说这条消息并不能给我带来很大的信息量。

在这里插入图片描述

但小伙伴跟我说:“意大利时隔53年再夺欧洲杯冠军!!!”,我就会很惊讶,因为这条消息给我的信息量很大。(类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值