自动编码器（VAE）的一些数学理解

最新推荐文章于 2024-09-27 07:11:53 发布

原创

最新推荐文章于 2024-09-27 07:11:53 发布 · 433 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #机器学习 #神经网络 #概率论

变分自编码器（VAE）是一种基于贝叶斯视角的深度学习模型，通过优化后验概率的近似表示来学习数据的潜在结构。本文详细介绍了KL散度、变分推断和VAE的基本模型，阐述了如何通过变分方法处理复杂的概率分布问题。在训练过程中，VAE面临后验失效问题，但仍然因其理论基础和可解释性而受到关注。此外，文章还讨论了VAE在图像生成等领域的应用及其优化技巧。

Auto-Encoding Variational Bayes

Auto-Encoding Variational Bayes论文原文

再谈变分自编码器VAE：从贝叶斯观点出发

Understanding Variational Autoencoders (VAEs)

Variational Inference（传统算法总结的比较全面）

1 预备知识

1.1 KL散度及变分

相对熵（relative entropy）就是KL散度（Kullback–Leibler divergence）。用于衡量两个概率分布 $p (x)$ 和 $q (x)$ 之间的差异，定义为：

$KL(p(x)||q(x))=\int p(x)\ln{p(x)\over q(x)}dx=\mathbb{E}_{x\sim p(x)}\left[\ln{p(x)\over q(x)}\right]$

(1) 度量分布的近似度距离

KL 散度的主要性质是非负性:

如果固定 $p (x)$ ，那么 $KL(p(x)||q(x))=0\leftrightarrow p(x)=q(x)$ ;

如果固定 $q (x)$ ，同样 $KL(p(x)||q(x))=0\leftrightarrow p(x)=q(x)$ ;

也就是不管固定哪一个，最小化 KL 散度的结果都是两者尽可能相等。

(2) 正定性

Gibbis Inequality：

$KL(p(x)||q(x))\ne KL(q(x)||p(x)) \le 0$ 当且仅当p=q时取等号。

(3) 非对称性

由于 $p (x)$ 和 $q(x) 在公式中的地位不是相等的，因此:

$KL(p(x)||q(x))\ne KL(q(x)||p(x))$

(4) 奇异性

KL 散度存在’‘奇异状态’’，就是当 $q (x)$ 在某个区域等于 0，而 $p (x)$ 在该区域不等于 0，那么 KL 散度就出现无穷大。

若 $p (x)$ 是真实分布， $q (x)$ 是拟合分布，则拟合分布趋于覆盖理论分布的所有范围（zero avoiding）；

若 $q (x)$ 是真实分布， $p (x)$ 是拟合分布，则拟合分布的0值不影响KL散度的积分（zero forcing）。

2 基本模型

2.1 基本问题

如果我们有一组观测数据 $D$ ，如何推断产生这些数据的模型 $m$ （得到观测数据 $D$ 的分布）?

2.2 基本假设

设所有 $n$ 维概率分布函数构成的空间为 $\mathscr{P}_n$ 。给定正整数 $d$ ， $n$ 维数据集 $X=\{ x^{(i)} \}_{i=1}^N$ 是通过如下两步生成的：

（i）通过某个先验分布 $p^{*}(z) \in \mathscr{P}_d$ 生成 $d$ 维隐状态 $z^{(i)}$ ；

（ii）通过某个条件概率 $q^*_z(x) \in \mathscr{P}_n$ 生成 $n$ 维数据 $x^{(i)}$ 。(为了与函数族的写法相仿，这里条件分布用下标表示。)

注：这里的隐状态可以是连续性随机变量（如预测身高时将年龄作为隐状态），也可以是离散型随机变量（如预测身高时将性别作为隐状态）。

当先验分布与条件分布给定时，后验分布也已经确定（可以用Bayes公式算出）：

$p^*_x (z) = \frac{q^*_z(x) p^*(z)}{q^*(x)} = \frac{q^*_z(x) p^*(z)}{\int{q^*_z(x) p^*(z) dz}}$

2

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Yi Xiao[旺柴] 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。