变分自编码VAE

最新推荐文章于 2024-12-29 20:53:12 发布

骨灰小鱼人提莫

最新推荐文章于 2024-12-29 20:53:12 发布

阅读量2.5k

点赞数

分类专栏：深度学习深度生成文章标签：图像处理

本文链接：https://blog.youkuaiyun.com/weixin_44881806/article/details/124057472

版权

深度学习同时被 2 个专栏收录

18 篇文章

订阅专栏

深度生成

6 篇文章

订阅专栏

前言

VAE模型是Kingma(也是Adam的作者)大神在2013年发表的文章，是一篇非常非常经典，且实现非常优雅的生成模型，同时它还为bayes概率图模型难以求解的问题提供了一种有效的思路。论文原名为Auto-Encoding Variational Bayes，是一种通用的利用auto-encoding方法结合variational lower bound求解bayes图模型隐变量的方法论。而VAE(Variational Auto-Encoding)是在该方法论下的一个具体示例。

先介绍一下有向图模型：

有向图模型（Directed Graphical Model），也称为贝叶斯网络（Bayesian Network）或信念网络（Belief Network，BN），是一类用有向图来描述随机向量概率分布的模型。常见的有向图模型：很多经典的机器学习模型可以使用有向图模型来描述，比如朴素贝叶斯分类器、隐马尔可夫模型、深度信念网络等。

问题引入

下面正式开始变分自编码贝叶斯理论的内容：

在面对大量数据和具有难以处理的后验分布的连续潜在变量的情况下，如何有效的学习有向概率图模型的参数？

作者寻求AEVB(Auto-Encoding Variational Bayes)的通用求解算法，试图推断和学习有向概率图模型的隐分布 z，并通过对 z 的采样来实现数据生成。最后作者提出的方法为，使用标准的基于梯度的优化方法能够优化随机目标函数的所有参数。该方法不需要 Monte Carlo EM 方法对每个数据点进行昂贵的采样循环，并且与唤醒睡眠算法不同，它所有参数更新与边缘似然的变分下限的优化有关。

假设数据集为，是由连续或离散变量 x 采样得到的N个样本。假设数据是由随机过程产生，且包含一个不可见的连续随机隐变量 z，如右图所示。那样本生成的过程分为两步：1> 从先验分布随机采样生成；2> 从条件概率分布中采样生成。但是这个过程在我们看来是隐藏的：真正的参数以及潜在变量的值对我们来说是未知的。