从贝叶斯公式理解扩散概率模型

理解扩散概率模型:从加噪到去噪的图像生成
本文介绍了扩散概率模型,从贝叶斯公式出发理解正向加噪过程,通过逐步增加噪声将清晰图像转换为高斯噪声。然后探讨逆向去噪过程,利用贝叶斯公式和正向过程的表达式,推导出从噪声图像恢复原始图像的步骤。最终,介绍训练和推理过程,模型通过预测噪声来实现图像去噪和生成。
快速理解扩散概率模型

注意:本文从贝叶斯公式出发理解去噪过程的原理,本文公式推导并不完全,跳过了一些繁琐运算的过程,但足够理解扩散模型的两个过程在做些什么,深入理解数学原理可以看看https://kexue.fm/archives/9119系列博客。

本文内容主要来自:

若有错误,望看官及时指正!


Overview

图片截自DDPM论文


Process
正向加噪

从一张真实干净的 x 0 x_0 x0逐步加噪到 x T x_T xT,每一步所加入的噪声比重越来越大,直至图像成为完全的高斯噪声。

整个过程是满足马尔可夫链性质(memoryless), x t x_t xt只与 x t − 1 x_{t-1} xt1有关( t ∈ [ 0 , T − 1 ] t \in [0, T-1] t[0,T1] T T T为设定的总扩散步数):
x t = α t x t − 1 + 1 − α t ϵ t x_t = \sqrt{\alpha_t}x_{t-1} + \sqrt{1-\alpha_t}\epsilon_t xt=αt xt1+1αt ϵt
β t = 1 − α t \beta_t=1-\alpha_t βt=1αt,这些都是根据 T T T预设好的常数, x 0 → x T x_0\rightarrow x_T x0xT加噪过程中,噪声系数开始较小,后来越来越大。
根据上式,可以进行递推:
x t = α t x t − 1 + 1 − α t ϵ t x_t=\sqrt{\alpha_t}x_{t-1}+\sqrt{1-\alpha_t}\epsilon_t xt=αt xt1+1αt ϵt
= α t x t − 1 + β t ϵ t =\sqrt{\alpha_t}x_{t-1}+\sqrt{\beta_t}\epsilon_t =αt xt1+βt ϵt
= α t ( α t − 1 x t − 2 + β t − 1 ϵ t − 1 ) + β t ϵ t =\sqrt{\alpha_t}(\sqrt{\alpha_{t-1}}x_{t-2}+\sqrt{\beta_{t-1}}\epsilon_{t-1})+\sqrt{\beta_{t}}\epsilon_t =αt (αt1 xt2+βt1 ϵt1)+βt ϵt
= ∏ k = 1 t α k x 0 + β 1 ϵ 1 ∏ k = 2 t α k + β 2 ϵ 2 ∏ k = 3 t α k + . . . + β t − 1 ϵ t − 1 ∏ k = t t α k + β t ϵ t =\sqrt{\prod_{k=1}^{t}{\alpha_k}}x_0+\sqrt{\beta_1}\epsilon_1\prod_{k=2}^{t}\sqrt{\alpha_{k}}+\sqrt{\beta_2}\epsilon_2\prod_{k=3}^{t}\sqrt{\alpha_{k}}+...+\sqrt{\beta_{t-1}}\epsilon_{t-1}\prod_{k=t}^{t}\sqrt{\alpha_{k}}+\sqrt{\beta_{t}}\epsilon_t =k=1tαk x0+β1 ϵ1

### 学习扩散模型的路径 为了系统地学习和理解扩散模型的原理及其应用,可以从以下几个方面入手: #### 1. 数学基础知识 扩散模型的核心依赖于概率论中的条件概率分布、联合概率分布以及边缘概率分布的概念。因此,掌握这些基本的概率理论是非常重要的[^1]。此外,熟悉贝叶斯定理和全概率公式的运用也是必不可少的一部分。 #### 2. 扩散模型的基础概念 深入研究扩散模型的工作机制,特别是前向扩散过程(逐步增加噪声的过程)和逆向扩散过程(逐渐减少噪声以恢复原始数据)。这一步骤需要理解如何通过马尔可夫链建模来实现上述两个过程,并且要清楚它们之间的转换关系是如何基于条件概率构建起来的。 #### 3. 参数初始化与优化技巧 合理有效的参数初始化方案能够显著改善扩散模型的表现。可以考虑使用预训练权重或者迁移学习技术来进行初始参数设定,这样不仅加快了收敛速度还提高了最终的效果。另外,在选择适合特定任务需求的最佳优化器时(比如SGD, Adam),调整诸如学习速率、批量大小之类的超参同样重要[^2]。 #### 4. AI绘画中的实践案例——去噪模型(Denoise Model) 在AI艺术创作领域里,扩散模型被广泛应用于生成逼真图像的任务当中。其中一个重要组成部分就是所谓的“去噪模型”,该部分主要负责估计给定含噪样本下的纯净信号形式。具体而言,它先经过一个名为Noise Predicter子网络预测当前帧内的随机扰动成分;然后再依据此信息计算得到更接近目标状态的新版本表示[^4]。 ```python def denoise_step(noisy_image, step): noise_pred = predict_noise(noisy_image, step) clean_estimate = noisy_image - noise_pred return clean_estimate ``` 以上代码片段展示了简化版的一次迭代操作流程:接收带有杂音干扰项作为输入变量`noisy_image`, 同时传入所处阶段索引号`step`; 调用函数`predict_noise()`获取对应时刻下可能存在的误差估值; 最终利用简单的代数运算得出净化后的近似解。 #### 5. 物理视角补充说明 (选修内容) 虽然这部分并非直接关联到算法推导环节之中,但从物理科学角度来看待扩散现象有助于加深整体认知水平。例如热传导方程式描述的就是热量沿空间传播变化规律,而这种动态演变模式恰好类似于我们在机器学习框架下定义的状态转移特性[^3]。 --- ###
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值