相对熵非负性的证明 汪俊磊 郎轲 刘思雨 叶佳佳 汪羽辰

相对熵

1.定义

相对熵(也称为KL散度或信息散度)是衡量两个概率分布之间差异的一种方法。若给定两个离散型随机变量的概率分布p_{i}q_{i}相对熵被定义为p_{i}q_{i} 之间的差异:

                                               D(p \/// q) = \sum_{i} p_i \log \ \frac{p_i}{q_i}                                                (1-1)

其中p_{i}q_{i} 分别表示PQ分布下随机变量取值为i 的概率。相对熵的值越大,表示两个分布之间的差异越大。

如果 PQ 是连续型随机变量的概率密度函数,则相对熵的定义为:

                                             D(p//q)=\int_{-\infty}^{ \infty}p(x)\log\frac{p(x)}{q(x)}dx                           (1-2)             

其中, p(x)q(x) 分别是pq 的概率密度函数。

2.性质

(1)非负性

  注:当且只有对所有i,p_{i},q_{i}时,相对熵为零。

(2)非对称性

相对熵可以看作两个概率测度纸质件的距离,即两个概率测度不同程度的度量,满足以下关系式                                              

D(p//q) \neq D(q // p)

相对熵非负性的证明

1.定义法证明

对于概率分布为p_{i}的某信源x,如果采用编码长度为I(p_{i})的方式进行编码,则平均码长为

H(p) = -\sum_{i} p_i I(p_i) = -\sum_{i} p_i \log p_i,如果采用概率分布为q_{i}的码长方式进行编码,每个符

号的编码长度为q_{i},则平均码长为 -\sum_{i} p_iI(q_{i})=-\sum_{i} p_i \log q_i 那么由于两种编码方式的概

率不匹配,使得平均码长增加,增加量即为相对熵:

-\sum_{i} p_i \log q_i=-[-\sum_{i} p_i \log p_i]=D(p//q),可知增加量一定是非负的,故得证。

2.利用 Jensen 不等式进行证明

对于凸函数的性质,我们可以写出Jensen不等式如下:

                                              f(\sum_{i=1}^{n}\lambda _{i}x_{i})\leqslant \sum_{i=1}^{n}\lambda _{i}f(x_{i})                                    (2-1)

相对熵的数学表达式D(p//q)=\sum_{i}^{n}p_{i}log \frac{p_{i}}{q_{i}}

\frac{p_{i}}{q_{i}} 替换成 x_{i},原公式转化为:

D(p//q)=\sum_{i}^{n}q_{i}\cdot x_{i} log x_{i},x\in(0,\infty),q_{i}\in(0,1)

              (2-2)

f(x_{i})=x_{i}logx_{i},上式变为

D(p//q)=\sum_{i}^{n}q_{i}\cdot f(x_{i}) ,x\in(0,\infty),q_{i}\in(0,1)

                   (2-3)

借助MATLAB绘图工具,我们画出了f(x_{i})=x_{i}logx_{i} 的图像

x = linspace(0.01, 2, 100); 
y1 = x .* log(x);
y2 = 0.6*x - 0.2;
plot(x, y1,x,y2);
xlabel('x');
ylabel('x*log(x)');
title('Plot of x*log(x)');
grid on;

因此我们知道f(x_{i})=x_{i}logx_{i} 是一个凸函数,满足Jensen不等式。

对上述表达式进行不等式的运算:

\sum_{i}^{n}q_{i}\cdot f(x_{i})\geqslant f(\sum_{i=1}^{n}q_{i} x_{i})=\sum_{i=1}^{n}q_{i} x_{i}log(\sum_{i=1}^{n}q_{i} x_{i}),x\in(0,\infty),q_{i}\in(0,1)

\sum_{i=1}^{n}q_{i} x_{i}log(\sum_{i=1}^{n}q_{i} x_{i})=f(\sum_{i=1}^{n}q_{i} x_{i})=(\sum_{i=1}^{n}q_{i}\cdot \frac{p_{i}}{q_{i}})log(\sum_{i=1}^{n}q_{i}\cdot \frac{p_{i}}{q_{i}})=1\cdot log1=0


等式成立的条件是:\frac{1}{n}\sum_{i}^{n}x_{i},i=1,2,3,4\cdot \cdot \cdot n对于相对熵,当且仅当p_{i}=q{i} 时,等号成立,因此,非负性得证。

3.泰勒展开法证明:

如果pQ 是连续型随机变量的概率密度函数,则证明如下:

log(p(x))在 x=q(x)处的展开是

logp(x)\geq log(q(x))+\frac{p(x)-q(x)}{q(x)}-o(\frac{1}{2}(\frac{p(x)-q(x)}{q(x)})^2)dx

D(p//q)\geq \int_{-\infty}^{\infty}p(x)(\frac{p(x)-q(x)}{q(x)}-o(\frac{1}{2}(\frac{p(x)-q(x)}{q(x)})^2))dx

                 \geq \int_{-\infty}^{\infty}p(x)(\frac{p(x)-q(x)}{q(x)}-o(\frac{1}{2}(\frac{p(x)-q(x)}{q(x)})^2))dx

                \approx\int_{-\infty}^{\infty}({p(x)-q(x)}-o(\frac{1}{2}(\frac{p(x)-q(x)}{q(x)})^2))dx

               =\int_{-\infty}^{\infty}({p(x)-q(x))dx}-\int_{-\infty}^{\infty}o(\frac{1}{2}(\frac{(p(x)-q(x))^2}{q(x)})dx

              =1-1-\frac{1}{2}\int_{-\infty}^{\infty}o(\frac{1}{2}(\frac{(p(x)-q(x))^2}{q(x)})dx

              =-\frac{1}{2}\int_{-\infty}^{\infty}o(\frac{1}{2}(\frac{(p(x)-q(x))^2}{q(x)})dx

             =0

当且仅当p(x) =q(x)时,等号成立。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值