深入理解扩散模型:Diffusion Models
本文综合最近阅读的关于扩散模型的一些基础博客和文章整理而成。主要参考的内容来自 Calvin Luo 的论文,针对的对象主要是对扩散模型已经有一些基础了解的读者。
引言
继OpenAI在2021提出的文本转图像模型DALLE之后,越来越多的大公司卷入这个方向,例如谷歌相继推出了Imagen和Parti。一些主流的文本转图像模型,例如DALL·E 2,stable-diffusion和Imagen采用了扩散模型(Diffusion Model)作为图像生成模型,这也引发了对扩散模型的研究热潮。
与GAN相比,扩散模型训练更稳定,而且能够生成更多样的样本,OpenAI的论文Diffusion Models Beat GANs on Image Synthesis也证明了<font color='red>扩散模型能够超越GAN。

论文地址:https://arxiv.org/abs/2105.05233
本文深入探讨扩散模型(Diffusion Models),包括前向扩散和反向生成过程,以及DDPM的原理和优化目标。与GAN相比,扩散模型训练更稳定,能生成多样样本。文章还介绍了模型设计、代码实现,并提及Stable Diffusion、DALL-E、Imagen等应用。
订阅专栏 解锁全文
1242

被折叠的 条评论
为什么被折叠?



