理解VAE：变分自编码器的框架与公式推导-优快云博客

本文深入探讨VAE的框架构建和公式推导。通过介绍如何利用变分方法近似后验概率分布，以及通过重参数化技巧解决反向传播问题，阐述了VAE在生成模型中的工作原理。文章强调在训练过程中平衡重构精度与生成能力，以及在编码器和解码器的设计中的关键作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在上一篇中，我自认为用浅显的语言向诸位介绍了VAE的整个发展的过程，在这篇中，将较多的涉及框架构建以及公式推导部分。

那么，开始吧

1）框架构建

首先我们有一批数据样本 x1,…,xn}，其整体用 X 来描述，我们本想根据 {x1,…,xn} 得到 X 的分布 p(X)，如果能得到的话，那我直接根据 p(X) 来采样，就可以得到所有可能的 X 了（包括 {x1,…,xn} 以外的），这是一个终极理想的生成模型了。但是，这个过程往往是很困难的。

于是，我们退而求其次，就想到了上文中提到的隐形变量Z，这个Z就是决定最终x形态的因素向量。给定一个图片Xk，我们假定p(Z|Xk)是专属于Xk的后验概率分布，这个概率分布服从正态分布。得到了这个概率，我们可以从分布中采样，并且通过最终的解码器将图片再恢复出来。

由于上述所说，我们所假设的这些分布都是正态分布，那么我们就需要求得相应的方差和均值，所以在编码实现的过程中，不难看到encoder部分真实做的事情就是，对相应的输入数据，通过两个网络产生了均值和方差。