手把手推导扩散模型:Diffusion Models(DDPM)
在这篇博客文章中,我们将深入研究 去噪扩散概率模型(也称为 DDPM,扩散模型,基于分数的生成模型或简单的 自动编码器) ,因为研究人员已经能够用它们在(非)条件图像/音频/视频生成方面取得显著成果。最受欢迎的例子(在写这篇文章的时候)包括由 OpenAI 设计的 GLIDE 和 DALL-E 2,由海德堡大学设计的 潜扩散,以及由谷歌大脑设计的 ImageGen。
DDPM理论回顾
生成扩散模型DDPM如下图所示分为前向、逆向两个过程,它首先通过不断往原始清晰数据中添加噪声使其变成标准高斯噪声(前向过程),而后期望从标准高斯噪声中还原原始数据(逆向过程)。若能实现,那便可从已知的标准高斯分布中采样一个噪声数据,而后利用DDPM模型生成符合原始数据分布的新数据。