深度学习《VAE-GAN》

最新推荐文章于 2024-10-09 20:41:04 发布

原创

最新推荐文章于 2024-10-09 20:41:04 发布 · 1.9w 阅读

·

20

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

VAE-GAN如下图所示，也就是VAE+GAN的组合。
我们知道VAE是由一个编码器一个解码器组成，编码器可以将数据映射到一个低维的空间分布code c，而解码器可以将这个分布还原回原始数据，因此decoder是很像GAN中的generateor，如果再后面拼接上一个判别器D，这样的话，前两个模块就是VAE，后俩模块就是GAN。
在这里插入图片描述

训练的时候，decoder输出的x’要和原始的x尽可能接近（L1或L2距离），x’和真实数据x经过D需要判别出是是否是真实的图片，训练结束后，我们就能直接取出GAN的部分做生成使用，也可以取出VAE的部分，做压缩降维处理。

为什么要这么设计呢？
VAE有一个很大的问题就是，解码产生的图片往往都比较模糊。虽然我们希望decoder输出的x’要和原始的x尽可能接近，也就是loss越小越好，但是很难真的能loss小到0啊，loss越小不代表图片越是看起来越真实啊，因此我们就需要一个判别器来判别图片是不是真实的，可以来帮助VAE提高真实性。

另一方面从GAN的角度来看，之前我们的generateor输入都是随机的，比如采样某个噪声输入，训练起来比较难，现在有了VAE，我么就能准确摸索到generateor的输入的大概空间分布了，这样会变得准确高效一些。

也就是VAE和GAN相辅相成，互帮互组，最后训练完了后，VAE和GAN都是表现的更加优秀。

既然VAE和GAN能相辅相成，我们也可以做出下面的变化，这是不是很熟悉？如下图：
在这里插入图片描述

是不是很熟悉？因为这个结构就像是CycleGAN的结构啊，我们希望输入generator的z和经过generator和encoder后得到的z越接近越好，此时也需要判别器D来帮助VAE提

最低0.47元/天解锁文章

6 条评论

weixin_51458923 2025.01.05
请问第二个方法是哪篇论文里的呢

qq_38125556 2023.02.23
还是不太能理解这个给定Z的作用是什么，为了让鉴别器的能力更强吗？
- Lobster_zero回复qq_38125556 2024.03.28
  相比于GANs原先从一个没有任何先验的噪声分布生成数据，这个Z的概率分布更符合原先数据的特征分布吧[face]emoji:028.png[/face]

weixin_43270557 2022.10.28
您好，我想问下，像这种模型在模型训练好后，生成数据的时候，是只需要输入正太分布z到生成器，就能输出想要的数据吗？

我会像蜗牛一样努力 2021.04.22
结果证明，这种模型在实验中比VAEGAN有少量的提升，这句话能再解释下吗？谢谢

不正经的kimol君 2020.12.09
学到了，点赞支持

评论 5

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。