【Diffusion】Denoising Diffusion Probabilistic Models (DDPM)小白入门指南

静静喜欢大白

已于 2025-01-14 10:39:57 修改

阅读量611

点赞数 12

分类专栏：医疗影像文章标签：人工智能 DDPM Diffusion 生成模型

于 2025-01-08 09:51:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/lj2048/article/details/144913037

版权

医疗影像专栏收录该内容

28 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

目录

2、生成式AI扩散模型-Diffusion Model

Denoising Diffusion Probabilistic Models

一、Diffusion的基本概念和运作方法

1.Diffusion Model是如何运作的？

2.Denoise模块内部正在做的事情

3. 如何训练Noise predictor？

4.Text-to-Image

5.两个Algorithm

二、Diffusion Framework

①Text Encoder：将文字输入encoder为向量

②Generation Model：输入一个噪声，得到图片的压缩版本

③Decoder：压缩的版本还原为原来的图片

2. Stable Diffusion

编辑3.DALL-E series

编辑4.Imagen (Google)

三、Diffusion Model数学原理剖析（1）

Algorithm1 Training

Algorithm2 Sampling

四、Diffusion Model数学原理剖析（2）

1.影像生成模型本质上的共同目标

2.Maximum Likelihood Estimation

An In-Depth Guide to Denoising Diffusion Probabilistic Models DDPM

2.什么是扩散生成模型

2.1前向扩散

2.2反向扩散

3.扩散模型的数学细节

3.1 前置知识

3.3 前向扩散

3.4 反向扩散

3.5 训练目标和损失函数

The Illustrated Stable Diffusion

Stable Diffusion的组成

文本编码器（Text Encoder）

图像信息生成器（Image Information Generator）

图像解码器（Image Decoder）

何为Diffusion

Diffusion 介绍

Diffusion 的工作原理--扩散如何运作

通过逐步移除噪声以生成图像

潜空间 Diffusion 以进行加速计算--速度提升：使用潜在数据而不是像素图像的扩散

Text Encoder：Transformer 语言模型

文本信息送入图像生成过程

Unet 噪声预测器的层（无文本）

带文本的 Unet 噪声预测器层

1、简介

扩散模型（Diffusion Models）发表以来其实并没有收到太多的关注，因为他不像 GAN 那样简单粗暴好理解。不过最近这几年正在生成模型领域异军突起，当前最先进的两个文本生成图像——OpenAI 的 DALL·E 2和 Google 的 Imagen，都是基于扩散模型来完成的。

text-to

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

静静喜欢大白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。