熵、条件熵、联合熵、互信息的理解

本文深入探讨了信息论中的核心概念——熵,包括其定义、计算方式及在条件熵、联合熵和互信息(信息增益)中的应用。熵作为衡量随机变量不确定性的指标,是理解数据内在信息量的基础。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在信息论中,熵(entropy)是表示随机变量不确定性的度量,如果一个事件是必然发生的,那么他的不确定度为0,不包含信息。假设XXX是一个取有限个值的离散随机变量,其概率分布为:
P(X=xi)=piP(X=x_i)=p_iP(X=xi)=pi
则随机变量XXX的熵定义为:
H(X)=−∑i=1npilog(pi)H(X)=-\sum_{i=1}^np_ilog(p_i)H(X)=i=1npilog(pi)
通常上式中logloglog的底数为2或eee(自然对数),这时熵的单位分别称作比特(bit)或纳特(nat)。并且通过上述定义可知,熵的取值只依赖于XXX的分布,而与XXX的具体值无关。
P=0.5P=0.5P=0.5的二项分布为例,熵HHH随概率ppp变化的曲线如下所示:
在这里插入图片描述

条件熵

设有随机变量(X,Y)(X, Y)(X,Y),其联合概率分布为:
P(X=xi,Y=yj)=pij, i=1,2,...,n; j=1,2,...,mP(X=x_i,Y=y_j)=p_{ij},\ i=1,2,...,n;\ j=1,2,...,mP(X=xi,Y=yj)=pij, i=1,2,...,n; j=1,2,...,m
条件熵(conditional entropy)表示在已知随机变量XXX的条件下随机变量YYY的不确定性,定义为XXX给定条件下YYY的条件概率分布的熵对XXX的数学期望:
H(Y∣X)=∑i=1npiH(Y∣X=xi),pi=P(X=xi),i=1,2,...,n.H(Y|X)=\sum_{i = 1}^{n}p_iH(Y|X=x_i),\quad p_i=P(X=x_i),i=1,2,...,n.H(YX)=i=1npiH(YX=xi),pi=P(X=xi),i=1,2,...,n.
在计算条件熵时,需要先分别计算XXX取不同值时变量YYY的熵,即H(Y∣X=xi)H(Y|X=x_i)H(YX=xi),总共nnn个(假设XXXnnn种不同取值),然后求其对XXX的期望。

互信息

互信息,在机器学习(决策树算法)中也称为信息增益。特征AAA对训练数据集DDD的信息增益g(D,A)g(D,A)g(D,A),定义为集合DDD的经验熵H(D)H(D)H(D)与特征AAA给定的条件下DDD的经验条件熵H(D∣A)H(D|A)H(DA)之差,即:
g(D∣A)=H(D)−H(D∣A)g(D|A)=H(D)-H(D|A)g(DA)=H(D)H(DA)

联合熵

联合熵度量的是一个联合分布的随机系统的不确定度,同样以联合概率分布(X,Y)(X, Y)(X,Y)为例,P(X=xi,Y=yj)=pij, i=1,2,...,n; j=1,2,...,mP(X=x_i,Y=y_j)=p_{ij},\ i=1,2,...,n;\ j=1,2,...,mP(X=xi,Y=yj)=pij, i=1,2,...,n; j=1,2,...,m,则联合熵H(X,Y)H(X,Y)H(X,Y)的定义为:
H(X,Y)=−∑i=1n∑j=1mpijlog(pij)H(X,Y)=-\sum_{i=1}^{n}\sum_{j=1}^{m}p_{ij}log(p_{ij})H(X,Y)=i=1nj=1mpijlog(pij)
联合熵具有以下性质(对于变量数目大于2的情况同样成立):

  1. 联合熵大于其中任一变量独立的熵:H(X,Y)>max{H(X),H(Y)}H(X,Y)>max\{H(X),H(Y)\}H(X,Y)>max{H(X),H(Y)}
  2. 联合熵小于所有变量独立熵之和:H(X,Y)&lt;H(X)+H(Y)H(X,Y)&lt;H(X)+H(Y)H(X,Y)<H(X)+H(Y)
  3. H(X,Y)=H(Y∣X)+H(X)=H(X∣Y)+H(Y)H(X,Y)=H(Y|X)+H(X)=H(X|Y)+H(Y)H(X,Y)=H(YX)+H(X)=H(XY)+H(Y)
  4. g(Y∣X)=H(X)+H(Y)−H(X,Y)g(Y|X)=H(X)+H(Y)-H(X,Y)g(YX)=H(X)+H(Y)H(X,Y)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值