【源码解读】扩散模型核心：DDPM专题-结合源码讲解

原创

已于 2023-06-28 21:48:16 修改 · 2.1k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #深度学习 #python

于 2023-06-28 21:43:51 首次发布

目录

1. 训练
2. 采样
3. 推理

本次训练采用的是cifar数据集，代码和下载好的数据将打包上传在百度网盘。

1. 训练

1.1 Uniform({1,…,T})

训练过程, t是随机采样获得的, 这一步是核心之一, 相当于伪代码中的 Step3: $\sim \operatorname{Uniform}(\{1, \ldots, T\})$

1.2 $\boldsymbol{\epsilon} \sim \mathcal{N}(\mathbf{0}, \mathbf{I})$

代码142行：生成均值为1，方差为0的标准高斯分布噪声

注意一个细节，t的维度是128，表示一个batchsize一起进行加噪

1.3 加噪

主要的函数代码在144行，这里将随机采样的加噪时间t，生成的noise和一个bath的image一起放入perturb函数中。

这里的加噪公式对应论文中的： $q\left(\mathbf{x}_{t} \mid \mathbf{x}_{0}\right)=\mathcal{N}\left(\mathbf{x}_{t} ; \sqrt{\bar{\alpha}_{t}} \mathbf{x}_{0},\left(1-\bar{\alpha}_{t}\right) \mathbf{I}\right)$

最低0.47元/天解锁文章

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。