Python【图解】信息熵

信息熵与信息论基础

最新推荐文章于 2024-09-14 09:04:29 发布

原创最新推荐文章于 2024-09-14 09:04:29 发布 · 4.6k 阅读

12 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

21 篇文章

订阅专栏

本文深入探讨了信息熵的概念，它是衡量随机事件不确定性的关键指标。通过数学公式和直观的例子，文章解释了信息熵如何随事件可能性的变化而变化，以及它在不同场景中的应用，包括联合熵、条件熵、互信息和最大熵模型。

文章目录

1、简介
2、公式
3、举个栗子
- 栗子1
- 栗子2
4、相关补充

1、简介

信息熵是随机事件不确定性的度量
信息熵越大，不确定性越高

2、公式

$\sum_{i=1}^{n} {p(x_i) \log_2 p(x_i)} = \sum_{i=1}^{n} {p(x_i) \log_2\frac{1}{p(x_i)}}$

先看下 $x \log_2 x$ 的函数图像：

import numpy as np, matplotlib.pyplot as mp
X = np.linspace(0.001, 1, 1001)
Y = - X * np.log2(X)
mp.plot(X, Y)

如图所示，概率P取值在0~1，概率为0或1时取最小值0（ $\lim_{x\rightarrow0} - x \log_2 x = 0$ ）

3、举个栗子

栗子1

黑箱中10个球，分红白2色，随机抽取1个：
$\log_2\frac{1}{P(红)} + P(白) \log_2\frac{1}{P(白)}$
若5红5白，信息熵为1.00，难以确定会抽到的哪个颜色；
若9红1白，信息熵为0.47，有较大几率抽到红球，不确定性较小；
若全为红球，则信息熵为0，必定抽到红球，无不确定性。

from math import log2
import matplotlib.pyplot as mp
for x in range(1, 10):
    p1 = x / 10
    p2 = 1 - p1
    X = [p1, p2]
    H = - sum([p * log2(p) for p in X])
    print('红球概率：%.2f、白球概率：%.2f、信息熵：%.2f' % (p1, p2, H))
    mp.bar(p1, H, color='r', width=0.018)

栗子2

import numpy as np, matplotlib.pyplot as mp
X = np.arange(1, 257)  # 物种数取值范围
H = []
for x in X:
    P = [1 / x for _ in range(x)]  # 物种数为x时，概率的集合
    H.append(- sum([p * np.log2(p) for p in P]))
mp.xlabel('species')
mp.ylabel('information entropy')
mp.plot(X, H)