人工智能_大模型065_多模态大语言模型13_DiffusionModel扩散模型_最小化分布差异_UNet去噪模型_DIT_基于Transformer的扩散模型---人工智能工作笔记0200

本文深入探讨扩散模型的工作原理,通过加噪声和逐步去噪的过程来解释图像恢复。文章介绍了UNet模型在去噪中的作用,分析了其编码器和解码器结构,以及在训练过程中如何学习去噪。此外,文章还提到了DIT模型,这是一个基于Transformer架构的扩散模型,能处理大量训练数据,改善图像细节处理问题,并讨论了如何通过引导生成可控内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

扩散模型,其实,首先要明确:

图片变成噪声图片,其实是给图片添加了高斯噪声,之所以叫做高斯噪声,是因为,添加的噪声的数据,呈现正态分布,

经过对噪声,进行一步步添加以后,最后,噪声就变成了一个正太分布的噪声.

而可以看到这里对于噪声:

要做的预测就是来预测噪声,而不是预测图像.

我们可以看到x0 到xt 是逐步添加的噪声,那么

通过上面的公式,知道任何一个x0到xt的,噪声数据,就可以,逐步预测到没有噪声时候的样子,

那么,去除这个图像中的哪些点,做为噪声,是需要预测的.

而这个预测模型:就是最小化高斯分布的差异.

也就是如果用高斯分布a,对图像加噪声,那么,如果能准确预测到这个高斯分布,那么就可以利用

这个高斯分布对图像去除噪声.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值