从工程和理论角度理解DDPM（一）

最新推荐文章于 2025-06-11 20:14:43 发布

Jia Di

最新推荐文章于 2025-06-11 20:14:43 发布

阅读量1k

点赞数 13

文章标签：算法机器学习概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_45453121/article/details/140590434

版权

从工程和理论角度理解DDPM

目录

从工程和理论角度理解DDPM

说明

紧接着上一篇VAE，继续整理DDPM。

1.与VAE的区别和关系

设数据集 $X$ 的分布 $P (X)$ ，其对于我们是未知的，但可以从里面进行采样。假设采样了一个观测变量 $x_0$ 。
从极大似然出发，然后引入隐变量，再到变分推导这一系列过程其实都和VAE一致，只不过隐变量改了一下

隐变量由单独一个 $z$ 变成了 $x_{1}, x_{2}, \ldots, x_{T}$ ，注意这些不是和 $x_0$ 平行的样本，而是由 $x_0$ 加噪得到的隐变量。
隐变量的维度是没有像VAE一样经过压缩的，即维度和 $x_0$ 一致。
边缘概率密度公式变为了：
$P(x_0) = \int P(x_{0:T}) dx_{1:T}, \ \ \ \ \ P(x_{0:T})=P(x_T)\prod_{t=1}^{T} P_{\theta}\left(x_{t-1} \mid x_{t}\right)$
贝叶斯公式变为了：
$P(x_0) = \frac{P(x_{0:T})}{P(x_{1: T} \mid x_{0})}, \ \ \ \ \ P(x_{1: T} \mid x_{0})=\prod_{t=1}^{T} P\left(x_{t} \mid x_{t-1}\right)$

2.变分推断

变分推断的公式基本和VAE的一致，最终也是转换成求解ELBO的代理任务
概率密度公式推导：
$\begin{aligned} \log P(x_0) & =\log \int P(x_{0:T}) dx_{1:T} \\ & =\log \int \frac{P(x_{0:T}) dx_{1:T} Q_{\phi}(x_{1: T} \mid x_{0})}{Q_{\phi}(x_{1: T} \mid x_{0})} dx_{1:T} \\ & =\log \mathbb{E}_{Q_{\phi}(x_{1: T} \mid x_{0})}\left[\frac{P(x_{0:T})}{Q_{\phi}(x_{1: T} \mid x_{0})} \right] \\ & \geq \mathbb{E}_{Q_{\phi}(x_{1: T} \mid x_{0})}\left[log \frac{P(x_{0:T})}{Q_{\phi}(x_{1: T} \mid x_{0})} \right] \end{aligned}$
贝叶斯公式推导：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。