信息熵,相对熵,交叉熵, 条件熵

本文深入探讨了信息论中的核心概念——信息熵、相对熵和交叉熵,解释了它们在衡量不确定性及分布距离上的作用。信息熵衡量分布的不确定性,随机变量状态越多,熵越大;相对熵量化了两个分布间的差异;交叉熵则用于评估非真分布求解熵的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

信息熵:表示分布的不确定性
随机变量的取值个数越多,状态数也就越多,信息熵就越大,混乱程度就越大。当随机分布为均匀分布时,熵最大
在这里插入图片描述
相对熵:有两个分布p,q,其中p为真实数据分布,q为相似的分布,那么相对熵就是两个分布之间的距离
在这里插入图片描述
交叉熵:用非真正的数据分布q来进行求解熵(基于原始分布P概率)
在这里插入图片描述

可见,交叉熵-信息熵=相对熵

条件熵:
条件熵 H(Y|X) 表示在已知随机变量 X 的条件下随机变量 Y 的不确定性。条件熵 H(Y|X) 定义为 X 给定条件下 Y 的条件概率分布的熵对 X 的数学期望:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值