4.扩散模型DDPM的发展脉络

wumg3000

已于 2024-03-24 16:31:18 修改

阅读量851

点赞数 10

分类专栏： AIGC 文章标签：深度学习机器学习人工智能

于 2024-03-15 21:27:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wumg3000/article/details/136750029

版权

本文介绍了自编码器、去噪自编码器、VAE、GAN和扩散模型，特别是DDPM与DDIM，以及它们在处理图像生成中的优势和改进。DiTs则通过Transformer架构提升效率。文章详细探讨了这些模型的工作原理、训练方法和优化策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2024-03-14 创建
2024-03-24 添加GAN，改进DDPM等内容

1. 自编码器（Autoencoder，AE ）

自编码器是神经网络的一种，经过训练后能尝试将输入复制到输出，该网络由两部分构成，,如下图所示，一个是编码器，h=f(x)表示编码器；另一个是解码器 $\hat{x}$ 。

现代自编码器将编码器和解码器的概念推广，将其中的确定函数推广为随机映射 $p_{encoder} (h|x)$ 和 $p_{decoder} (x|h)$ 为了从自编码器获取有用特征，通常使编码器的输出h维度较小，这种编码维度小于输入维度的自编码器称为欠完备自编码器，学习欠完备的表示将强制自编码器捕获训练数据中最显著的特征。
学习过程可以简单描述为最小化一个损失函数：
$\underset{f,g}{argmin} L(x,g(f(x)))$
惩罚g(f(x))与x的差异，如均方误差。
如果自编码器的容量太大，那么训练执行复制任务的自编码器可能无法学习到数据集的任何有用信息。

2.去噪自编码器（Denoising autoencoder，DAE ）

去噪自编码器的输入为被损坏数据（或添加噪声），并训练来预测原始没被损坏数据作为输出的自编码器。其架构图如下所示：

<

最低0.47元/天解锁文章

博客等级

码龄11年

22
原创

92
点赞

204
收藏

68
粉丝

关注

私信

热门文章

分类专栏

AIGC 1篇
LLM 3篇
GPT 5篇

最新评论

第5章机器学习基础(3/3)-GPU加速
2305_80780680: 假如說在Tensorflow 上訓練簡單的MLP，如果在单一一张GPU上，有办法知道说他是如何调用GPU资源吗，比如说矩阵运算的平行使用了多少的warp和thread，及如何自动分配这样，因为TF内gpu是直接到调用的，想了解相关演算法，以一个50x50的矩阵，他可以2500同时处理，但其中涉及memory问题，可能使用了tile技术或是一个thread处理一个以上的矩阵内值，不知道能不能了解这个部分，谢谢！
4.扩散模型DDPM的发展脉络
优快云-Ada助手: Python入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
第5章微调GPT-2生成戏剧文本
御风而行_652: 5.5的select_top_k()函数在第四章定义了，大家参考的时候记得在循环之前加上函数的定义。 [code=python] import random def select_top_k(predictions, k=10): predicted_index = random.choice( predictions[0, -1, :].sort(descending=True)[1][:10]).item() return predicted_index [/code]
第5章微调GPT-2生成戏剧文本
御风而行_652: 5.4训练模型中间那行 loss, logits, _ = model(data, labels=target) 是不是该是 loss = model(data, labels=target)[0] 啊？
第5章微调GPT-2生成戏剧文本
御风而行_652: 这一章的5.4训练模型的代码会报错耶，我用的Jupyter Lab，“loss.item()”和后面的“loss.backward()”会报错：AttributeError: 'str' object has no attribute 'item'。尝试了redis降级安装也不行，求求大佬指导下。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。