正向扩散过程是扩散模型的 “正向引擎”,其核心是通过确定性的逐步加噪,将真实数据(如图像)转化为完全随机的噪声。这一过程既有严格的数学保证(确保最终收敛到标准正态分布),又能通过直观案例理解其演化规律。以下结合数学推导与直观解释,全面解析正向扩散的机制。
一、核心目标:从数据分布到噪声分布
正向扩散的最终目标是:通过 T 步(通常取 1000 或 2000)迭代加噪,将初始真实数据 (服从数据分布
)逐步转化为完全服从标准正态分布(
)的噪声
。
这一过程需满足两个关键特性:
- 平滑性:每一步仅添加微小噪声,确保数据分布的变化连续可导,为反向去噪提供可学习的梯度;
- 收敛性:当
时,最终状态
严格收敛到标准正态分布,与原始数据的初始分布无关。
二、核心定义与参数体系
正向扩散的数学框架建立在三个核心参数和一个迭代规则上,这些定义是后续推导的基础:
-
噪声强度序列:
其中
,表示第t步的噪声占比(
),通常设计为单调递增序列(如
,
),确保后期加噪更强。
-
保真性系数:
表示第t步保留的原始数据比例(
越小,噪声影响越大)。
-
累积保真性系数:
是前t步保真性系数的乘积,衡量经过t步后原始数据
的 “残留权重”(t越大,
越小)。
-
迭代加噪规则:第t步的含噪数据
由上一步
生成:
其中是独立同分布的标准正态噪声(与数据同维度,每个元素独立采样)。
三、迭代公式的展开:从
到
的显式表达
为理解正向扩散的累积效应,需将迭代公式(1)逐步展开,推导 与初始数据
、所有步噪声的关系。
1. 前几步的展开示例(直观理解)
-
当
时:
(原始数据占比高,噪声仅轻微影响,类似给清晰图像加一层薄雾)
-
当
时,将
代入公式(1):
(原始数据占比下降,噪声影响累积,图像雾更浓)
2. 通用公式的归纳(数学抽象)
通过观察的展开式,可归纳出t步时的通用公式:
公式解读:
- 第一项
:原始数据
的贡献,权重为累积保真性系数的平方根;
- 第二项:前t步噪声的加权和,每个噪声
的权重随步数变化。
工程价值:无需迭代计算,可直接从
生成
,大幅提升训练效率。
四、极限收敛性:当
时,
正向扩散的核心结论是:当步数T趋近于无穷时,最终状态严格服从标准正态分布。这一结论需通过分析公式(5)中两项的极限行为证明。
1. 原始数据项的极限:
累积保真性系数 的极限行为取决于
的求和性质:
- 数学中,对于序列
,若
,则
(乘积发散至 0)。
- 扩散模型中,噪声强度序列
被设计为
(如线性增长的
,总和随T增大而无限增大)。
因此:
进而导致原始数据项:
直观类比:这如同 “无限次稀释墨水”,无论初始颜色多深,最终都会被清水完全冲淡,原始颜色的影响消失。
2. 噪声累积项的极限:服从
噪声累积项是 “独立高斯变量的线性组合”,根据高斯分布的两个关键性质:
- 可加性:独立高斯变量的线性组合仍为高斯变量;
- 方差可加性:组合后的方差等于各变量方差与权重平方的乘积之和。
对噪声累积项的方差进行计算(记为):
通过代数化简(利用 和
):
(推导细节:展开乘积项后中间项全部抵消,仅剩首尾两项1和
)
当时,结合式(6)得:
同时,噪声累积项的均值为0(因每个 ,均值为 0)。因此:
3. 最终结论
结合式(7)和式(11),当时:
五、噪声 Schedule 的设计:平衡平滑性与收敛性
噪声强度序列的设计直接影响正向扩散效果,需满足两个关键约束:
-
总噪声强度发散:
确保
,原始数据项完全消失。若总和有限,
无法完全噪声化。
-
单步噪声强度有界:
(
)避免单步加噪过强(如
会一步将数据变为纯噪声),确保前向过程平滑,为反向去噪提供可学习的梯度。
常见设计方案:
- 线性 Schedule:
从 0.0001 线性增长到 0.02(简单直观,早期保结构,后期加速噪声化);
- 余弦 Schedule:基于余弦函数设计,加噪强度先缓后快,使分布更接近高斯(DDIM、Stable Diffusion 采用)。
六、直观演化过程:从 “清晰图像” 到 “随机噪声”
以图像为例,正向扩散的演化可分为三个阶段:
-
初始阶段(
):
极小,
,原始图像结构清晰,仅轻微模糊(如照片加薄雾)。
-
中期阶段(
):
,图像细节丢失,整体朦胧,但仍能识别大致内容(如雾中看物)。
-
终末阶段(
):
,原始图像影响可忽略,视觉上表现为完全随机的 “灰色噪点”(符合标准正态分布的视觉特征)。
七、核心作用:为反向生成铺路
正向扩散的价值不仅是 “破坏数据”,更重要的是构建了从 “数据分布” 到 “噪声分布” 的连续映射,这一映射具有:
- 可逆性:每一步加噪都是可逆的(理论上可通过贝叶斯公式推导逆过程);
- 可学习性:噪声的累积规律可被神经网络捕捉,为反向去噪提供 “如何从噪声恢复数据” 的学习目标。
总结
正向扩散过程通过确定性的逐步加噪和精心设计的噪声强度序列,实现了从真实数据到标准正态噪声的平滑过渡。其核心贡献是:
- 数学上严格证明了最终状态收敛到标准正态分布,为反向生成提供了明确起点;
- 直观上通过 “噪声累积、数据稀释” 的过程,使反向去噪的学习目标可感知、可优化。
理解正向扩散的数学机制与直观演化,是掌握扩散模型生成逻辑的关键基础。
1万+

被折叠的 条评论
为什么被折叠?



