17、信息论基础:熵、KL散度与互信息

信息论基础:熵、KL散度与互信息

1. 联合熵

1.1 联合分布与联合熵计算

给定联合分布:
| | Y = 0 | Y = 1 |
| — | — | — |
| X = 0 | 1/8 | 3/8 |
| X = 1 | 3/8 | 1/8 |

联合熵的计算公式为:
$H (X, Y ) = - \left[\frac{1}{8} \log_2 \frac{1}{8} + \frac{3}{8} \log_2 \frac{3}{8} + \frac{3}{8} \log_2 \frac{3}{8} + \frac{1}{8} \log_2 \frac{1}{8} \right] = 1.81$ 比特

1.2 联合熵的上下界

  • 上界 :当 $X$ 和 $Y$ 相互独立时,$H (X, Y ) = H (X) + H (Y )$。一般情况下,$H (X, Y ) \leq H (X) + H (Y )$。这是因为当变量之间存在某种关联时,系统的“自由度”会降低,从而导致整体熵减少。
  • 下界 :若 $Y$ 是 $X$ 的确定性函数,则 $H (X, Y ) = H (X)$。所以,$H (X, Y ) \geq \max{H (X), H (Y )} \geq 0$。直观地说,将变量组合在一起不会使熵降低,要减少不确定性需要观察一些数据。

联合熵的定义可以很自然地从两个变量扩展到 $n$ 个变量。

2. 条件熵

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值