P517 exercises 10.3 solution(solution to exercises tutor’s edition p164)
从公式(10.6)开始,推导整理可得
KL( p||q )=====−∫p(Z)[∑i=1Mlnqi(Zi))]dZ+const.−∫⎛⎝p(Z)lnqj(Zj)+p(Z)∑i≠jlnqi(Zi))⎞⎠dZ+const.−∫p(Z)lnqj(Zj)dZ+const.−∫lnqj(Zj)⎡⎣∫p(Z)∏i≠jdZi⎤⎦dZj+const.−∫Fj(Zj)lnqj(Zj)dZj+const.,
其中
F=Fj(Zj)=∫p(Z)∏i≠jdZi
const表示与qj(Zj)无关的项, 最小化KL divergence中可以忽略
根据约束∫p(Z)dZ=1加入Lagrange multiplifier得
δF=−∫Fj(Zj)lnqj(Zj)dZj+λ(∫qj(Zj)dZj−1)
整理, 得到优化的目标函数, 该函数为泛函数δF(qj(Zj),Zj)
δF=∫{Fj(Zj)lnqj(Zj)+λqj(Zj)}dZj+λ
由于λ为常数优化中可以忽略, 且按照Appendix D中的(D.5)公式,可得,
G=Fj(Zj)lnqj(Zj)+λqj(Zj)
∂Gqj(Zj)=0
根据AppendixD的Euler−Lagrangeequation的简化假设G(y,x)不依赖于∂yx, 求函数δF的驻点即为求functional derivative ∂Gqj(Zj)=0, 由此得
−Fj(Zj)q(Zj)+λ=0
移项变换以后得
λqj(Zj)=Fj(Zj).
λ=∫Fj(Zj)dZj=∫⎡⎣∫p(Z)∏i≠jdZi⎤⎦dZi=1,
将λ=1代入λqj(Zj)=Fj(Zj)可得
q∗j(Zj)=Fj(Zj)=∫p(Z)∏i≠jdZi.
即p468 的(10.17)

2945

被折叠的 条评论
为什么被折叠?



