扩散模型（Diffusion Models）

最新推荐文章于 2025-06-01 21:25:05 发布

原创最新推荐文章于 2025-06-01 21:25:05 发布 · 496 阅读

CC 4.0 BY-SA版权

文章标签：

168 篇文章

订阅专栏

153 篇文章

订阅专栏

扩散模型（Diffusion Models）是一种基于概率论的生成模型，其核心思想是通过模拟数据在潜在空间中逐步“扩散”和“去噪”的过程来生成高质量的数据样本。

在这里插入图片描述

扩散模型属于生成模型的一种，最初灵感来自物理学中的扩散现象（如墨水在水中扩散）和非平衡热力学理论。它通过马尔可夫链对数据分布进行建模，将数据生成过程分解为逐步加噪（正向扩散）和去噪（反向扩散）两个阶段，最终从随机噪声中恢复出原始数据分布。

扩散模型的核心流程分为两个阶段：

正向扩散过程（Forward Process）：
从原始数据（如图像）出发，通过一系列逐步添加高斯噪声的步骤，将数据逐渐破坏为纯噪声。每一步的噪声量由预定义的参数 (\beta_t) 控制，数学上可描述为：
[
q(x_t | x_{t-1}) = \mathcal{N}(x_t; \sqrt{1-\beta_t} x_{t-1}, \beta_t I)
]
这一过程最终将数据完全转化为高斯分布噪声。
反向扩散过程（Reverse Process）：
从纯噪声出发，通过训练神经网络（如DDPM、SGMs等）逐步预测并去除噪声，最终生成符合原始数据分布的高质量样本。这一过程需要学习复杂的概率分布逆转，通常借助变分推断或**随机微分方程（SDEs）**实现。