KL 散度

定义
所谓KL散度,是指当某分布q(x)被用于近似p(x)时的信息损失。
在这里插入图片描述

也就是说,q(x)能在多大程度上表达p(x)所包含的信息,KL散度越大,表达效果越差。

  1. 信息熵

KL散度来源于信息论,信息论的目的是以信息含量来度量数据。信息论的核心概念是信息熵(Entropy),使用H来表示。概率论中概率分布所含的信息量同样可以使用信息熵来度量。

Entropy

如果式中的log以2为底的话,我们可以将这个式子解释为:要花费至少多少位的编码来表示此概率分布。从此式也可以看出,信息熵的本质是一种期望。

  1. KL散度的由来

当我们使用一个较简单、常见的分布(如均匀分布、二项分布等)来拟合我们观察到的一个较为复杂的分布时,由于拟合出的分布与观察到的分布并不一致,会有信息损失的情况出现。KL散度就是为了度量这种损失而被提出的。

若我们使用分布q来表示分布p,那么信息熵的损失如下

信息熵损失

可将该式写作期望的形式
在这里插入图片描述

稍加变形,称为定义中的形式
在这里插入图片描述

参考文献
https://zhuanlan.zhihu.com/p/95687720
Kullback–Leibler KL Divergence
Kullback-Leibler Divergence Explained — Count Bayesie

### KL的概念 KL,全称为Kullback-Leibler Divergence,是一种量化两种概率分布\( P \)和\( Q \)之间差异的方式[^4]。它也被称作相对熵(Relative Entropy),用于衡量当用一个概率分布\( Q \)来表示真实的概率分布\( P \)时所需的额外信息量[^3]。 ### 计算方法 对于离型随机变量,假设存在两个概率质量函数\( p(x) \)和\( q(x) \),那么KL可由下述公式给出: \[ D_{KL}(P||Q)=\sum_x{p(x)\log{\frac{p(x)}{q(x)}}} \] 而对于连续型随机变量,则通过积分形式表达: \[ D_{KL}(P||Q)=\int{-p(x)\log{\frac{q(x)}{p(x)}}dx} \] 值得注意的是,KL不是对称的,即\( D_{KL}(P||Q) \neq D_{KL}(Q||P) \)[^1]。 ```python import numpy as np from scipy.stats import entropy def calculate_kl_divergence(p, q): """Calculate the Kullback-Leibler divergence between two discrete distributions.""" return entropy(p, q) # Example usage with two simple probability distributions. distribution_p = [0.2, 0.5, 0.3] distribution_q = [0.4, 0.4, 0.2] kl_divergence_value = calculate_kl_divergence(distribution_p, distribution_q) print(f"The calculated KL-Divergence is {kl_divergence_value}") ``` ### 应用场景 在机器学习中,KL被广泛应用于评估模型预测的概率分布与实际数据的真实分布间的差距,从而辅助于模型的选择和调优工作。比如,在聚类算法里,可以通过比较各簇内样本点对应的概率分布之间的KL来进行效果评价;另外,在变分自编码器(VAEs)等生成对抗网络(GANs)架构下的训练过程中也会涉及到KL的应用[^2]。 ### 信息论视角 从信息论的角来看,如果试图利用某个次优的概率分布去压缩原始的数据流,将会引入冗余——这部分多余的比特数正好对应着两者间KL大小的表现形式之一。 ### 统计学意义 统计学家们经常采用简化版或是近似版本的概率密函数代替那些难以处理的实际观测到的数据集上的复杂分布模式。此时,KL提供了一种有效手段用来测量因这种替换而产生的信息丢失程
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值