快速理解扩散概率模型
注意:本文从贝叶斯公式出发理解去噪过程的原理,本文公式推导并不完全,跳过了一些繁琐运算的过程,但足够理解扩散模型的两个过程在做些什么,深入理解数学原理可以看看https://kexue.fm/archives/9119系列博客。
本文内容主要来自:
若有错误,望看官及时指正!
Overview

Process
正向加噪
从一张真实干净的 x 0 x_0 x0逐步加噪到 x T x_T xT,每一步所加入的噪声比重越来越大,直至图像成为完全的高斯噪声。
整个过程是满足马尔可夫链性质(memoryless), x t x_t xt只与 x t − 1 x_{t-1} xt−1有关( t ∈ [ 0 , T − 1 ] t \in [0, T-1] t∈[0,T−1], T T T为设定的总扩散步数):
x t = α t x t − 1 + 1 − α t ϵ t x_t = \sqrt{\alpha_t}x_{t-1} + \sqrt{1-\alpha_t}\epsilon_t xt=αtxt−1+1−αtϵt
记 β t = 1 − α t \beta_t=1-\alpha_t βt=1−αt,这些都是根据 T T T预设好的常数, x 0 → x T x_0\rightarrow x_T x0→xT加噪过程中,噪声系数开始较小,后来越来越大。
根据上式,可以进行递推:
x t = α t x t − 1 + 1 − α t ϵ t x_t=\sqrt{\alpha_t}x_{t-1}+\sqrt{1-\alpha_t}\epsilon_t xt=αtxt−1+1−αtϵt
= α t x t − 1 + β t ϵ t =\sqrt{\alpha_t}x_{t-1}+\sqrt{\beta_t}\epsilon_t =αtxt−1+βtϵt
= α t ( α t − 1 x t − 2 + β t − 1 ϵ t − 1 ) + β t ϵ t =\sqrt{\alpha_t}(\sqrt{\alpha_{t-1}}x_{t-2}+\sqrt{\beta_{t-1}}\epsilon_{t-1})+\sqrt{\beta_{t}}\epsilon_t =αt(αt−1xt−2+βt−1ϵt−1)+βtϵt
= ∏ k = 1 t α k x 0 + β 1 ϵ 1 ∏ k = 2 t α k + β 2 ϵ 2 ∏ k = 3 t α k + . . . + β t − 1 ϵ t − 1 ∏ k = t t α k + β t ϵ t =\sqrt{\prod_{k=1}^{t}{\alpha_k}}x_0+\sqrt{\beta_1}\epsilon_1\prod_{k=2}^{t}\sqrt{\alpha_{k}}+\sqrt{\beta_2}\epsilon_2\prod_{k=3}^{t}\sqrt{\alpha_{k}}+...+\sqrt{\beta_{t-1}}\epsilon_{t-1}\prod_{k=t}^{t}\sqrt{\alpha_{k}}+\sqrt{\beta_{t}}\epsilon_t =k=1∏tαkx0+β1ϵ1
理解扩散概率模型:从加噪到去噪的图像生成

本文介绍了扩散概率模型,从贝叶斯公式出发理解正向加噪过程,通过逐步增加噪声将清晰图像转换为高斯噪声。然后探讨逆向去噪过程,利用贝叶斯公式和正向过程的表达式,推导出从噪声图像恢复原始图像的步骤。最终,介绍训练和推理过程,模型通过预测噪声来实现图像去噪和生成。
最低0.47元/天 解锁文章
398





