上文从 KL(q(x,y)‖p(x,y)) K L ( q ( x , y ) ‖ p ( x , y ) ) 推导出GAN的两个Loss,并给出生成器Loss的正则项设计思路,接下来我们仍从引入隐变量构成联合概率分布角度,推导VAE的Loss。
首先,我们观察 KL(p(x,z)‖q(x,z)) K L ( p ( x , z ) ‖ q ( x , z ) ) 有:
KL(p(x,z)‖q(x,z))=KL(p(x)‖q(x))+∫p(x)KL(p(z|x)‖q(z|x))dx≥KL(p(x)‖q(x))(1) K L ( p ( x , z ) ‖ q ( x , z ) ) = K L ( p ( x ) ‖ q ( x ) ) + ∫ p ( x ) K L ( p ( z | x ) ‖ q ( z | x ) ) d x ≥ K L ( p ( x ) ‖ q ( x ) ) ( 1 )
即 KL(p(x,z)‖q(x,z)) K L ( p ( x , z ) ‖ q ( x , z ) ) 是 KL(p(x)‖q(x)) K L ( p ( x ) ‖ q ( x ) ) 的上界,优化此上界就达到了优化 KL(p(x)‖q(x)) K L ( p ( x ) ‖ q ( x ) ) 本身。
对于VAE而言, x x 表示数据样本空间的一个数据点,e.g:MNIST的图片空间是784(28*28)维度空间; z z 表示编码器生成的编码(Code),它是一个多维随机变量,一般为100维,于是有:
1、真实分布: p(x,z)=p(z