信息熵推导

本文探讨了信息熵的概念,通过实例解释了概率与信息量之间的关系,包括概率为0和1时的信息量特性,以及概率大小对信息量的影响。
 

设对于某个事件 x, 发生的概率是 p(x), 对应的"信息量"是 I(x).

性质

1. p(x) = 0  =>  I(x) = +\inf (正无穷大)

2. p(x) = 1  =>  I(x) = 0

3. p(x)>p(y)  =>  I(x)<I(y)

含义是概率为 的事件对应的信息量大反之信息量少.

我们概率老师举的例子是皇家马德里与中国队踢那么皇马赢的概率...是人都知道...所以没有信息量(=0). 反之若是中国队赢了这个信息量就大了.

4. I(x)>=0    信息量总是正的.

5. p(x,y)=p(x)p(y)  =>  I(x,y)=I(x)+I(y)

信息量的叠加性知道了两个独立事件的概率相当于知道了两方的信息(的和)

由以上性质就能决定出 I(x) = -c*ln(p(x)), 其中 是某个正常数代入就可验证.

最后的信息熵公式 - sum p[i] * ln(p[i]) 可以看作 ln(p) 的期望也就是整个系统的平均信息的多少.

信息熵的计算公式为: $$ H(X) = -\sum_{i} p(x_i) \log_b p(x_i) $$ 其中,$ p(x_i) $ 表示事件 $ x_i $ 发生的概率,$ \log_b $ 是以 $ b $ 为底的对数函数,通常使用以 2 为底(单位为比特)或以 $ e $ 为底(单位为纳特)。该公式的推导基于几个关键假设,包括连续、对称、确定和可加,这些原则确保了函数的唯一与合理[^2]。 ### 图像中的信息熵 在图像处理中,信息熵用于衡量图像像素灰度分布的不确定或混乱程度。图像的计算公式与信息熵相同,但通常基于图像像素的灰度分布: $$ H(I) = -\sum_{i} p(g_i) \log_2 p(g_i) $$ 其中,$ p(g_i) $ 表示图像中灰度值 $ g_i $ 出现的概率。图像越高,表示图像的灰度分布越复杂,信息量越大;反之,图像越低,表示图像越单调或越简单。图像常用于图像压缩、图像质量评估和特征提取等场景[^3]。 ### 代码示例:计算图像的信息熵 以下是一个使用 Python 和 OpenCV 计算图像信息熵的示例: ```python import cv2 import numpy as np def calculate_image_entropy(image_path): # 读取图像并转换为灰度图 image = cv2.imread(image_path) gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 计算灰度直方图 hist = cv2.calcHist([gray_image], [0], None, [256], [0, 256]) hist_prob = hist / hist.sum() # 转换为概率分布 # 计算信息熵 entropy = -np.sum(hist_prob * np.log2(hist_prob + np.finfo(float).eps)) # 避免除以零 return entropy # 示例调用 image_entropy = calculate_image_entropy("example_image.jpg") print(f"Image Entropy: {image_entropy}") ``` ### 应用场景 1. **数据压缩**:信息熵用于衡量数据的冗余度,从而指导压缩算法的设计。例如,在 JPEG 图像压缩中,编码(如霍夫曼编码)利用图像的实现高效压缩。 2. **图像质量评估**:高图像通常包含更多细节和复杂,因此信息熵可作为图像质量的参考指标之一。 3. **特征提取与模式识别**:在计算机视觉中,信息熵可用于提取图像的复杂度特征,帮助区分不同类型的图像内容(如纹理图像与平滑图像)。 4. **密码学与随机分析**:信息熵用于评估数据的随机,从而判断密码系统的安全
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值