1.Introduction
Variational Autoencoders (VAEs) 是一种无监督学习复杂分布的方法,VAEs已经显示出产生多种复杂数据的潜力,包括手写数字,面部,门牌号码,CIFAR图像,场景的物理模型和分割以及从静态图像预测未来。
生成模型是机器学习一个很广泛的领域,求高维空间的X的分布P(x),比如,图像就是一种可以创建生成模型的数据类型,每一幅图像都有成千上万的维度(元素),成模型的工作是以某种方式捕获像素之间的依赖关系,例如附近的像素具有相似的颜色并将其组织为对象。
2.VAE AutoEncoder
P ( X ∣ Z ) P(X|Z) P(X∣Z)是一个isotropic Gaussian,即 P ( X ∣ Z ) P(X|Z) P(X∣Z)~ N ( f ( Z ; θ ) , σ 2 I ) N(f(Z;θ),σ^2I) N(f(Z;θ),σ2I) , I I I为单位矩阵, f ( z ; θ ) f(z;\theta) f(z;θ)为均值, σ 2 I \sigma^2I σ2I为协方差矩阵。 − l o g P ( X ∣ Z ) -logP(X|Z) −logP(X∣Z)和f(Z)与X的欧式距离的平法成比例, − l o g 1 2 ∗ π -log \frac{1}{\sqrt2*\pi} −log2∗π1为一常数不影响概率比较,证明公式如下:
− l o g P ( X ∣ Z ) = − ∑ i = 1 n l o g ( P ( X i ∣ Z ) = ∑ i = 1 n − l o g 1 2 ∗ π + ( X ( 1 ) − f ( Z ) ( i ) ) 2 2 δ 2 -logP(X|Z)=-\sum_{i=1}^n log(P(X_i|Z)=\sum_{i=1}^n -log \frac{1}{\sqrt2*\pi}+\frac{(X^{(1)}-f(Z)^{(i)})^2}{2\delta^2} −logP(X∣Z)=−i=1∑nlog(P(Xi∣Z)=i=1∑n−log2∗π1+2δ2(X(1)−f(Z)(i))2
∣ ∣ f ( Z ) , X ∣ ∣ 2 = ∑ i = 1 n ( f ( Z ) ( i ) − X ( i ) ) 2 ||f(Z),X||^2=\sum_{i=1}^n (f(Z)^{(i)}-X^{(i)})^2 ∣∣f(Z),X∣∣2=i=1∑