生成式对抗网络GAN（Generative Adversarial Nets）论文笔记

原创

已于 2022-07-28 15:04:38 修改 · 2.3k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#生成对抗网络 #深度学习 #人工智能

于 2020-03-22 22:42:41 首次发布

本文深入解析生成式对抗网络(GAN)的工作原理，介绍其在数据分布捕捉与样本评估中的应用，探讨GAN与传统模型的区别，并通过实验展示GAN在图像生成方面的潜力。

1.介绍

本文基本从2014年《Generative Adversarial Nets》翻译总结的。
GAN（Generative Adversarial Nets），生成式对抗网络。包含两个模型，一个生成模型G，用来捕捉数据分布，一个识别模型D，用来评估采样是来自于训练数据而不是G的可能性。

这两个模型G与D是竞争关系、敌对关系。比如生成模型G就像是在制造假的货币，而识别模型D就像是警察，尝试检测这些假币。这两个模型间的竞争，使它们都在不断完善自己，直到假币和真币无法区分为止。

本论文的例子，训练两个模型时仅使用了反向传播和dropout 算法，在从生成模型中采样时，只使用的前向传播。近似推理或者Markov chain是不必要的。

2.相关方法

（1）定向图模型与非定向图模型，比如限制玻尔兹曼机（RBMs）、深度玻尔兹曼机(DBMs)、以及相关变体。这些模型使用了归一化处理，针对随机参数的所有状态。这些归一化比例函数以及他们的梯度是很难计算的，虽然可以采用Markov chain Monte Carlo（MCMC）方法进行估计。
（2）DBNs(Deep belief networks) 是组合模型，包括一个非定向层和一堆定向层。当一个快速近似逐层训练存在时，DBNs在集合非定向与定向模型时也会面临计算困难的问题。
（3）生成随机网络GSN, 使用了Markov chain。而GAN不需要Markov chain，因为在生成时，不需要反向传播。

3.对抗网络

p（z）:带有噪声的输入；
G（z,θ）:一个可微分的函数，带参数θ的多层感知机；
D（x）:代表x是来自于data还是来自于生成函数的概率。
整体训练函数如下，最大化D，同时针对G来最小化log（1-D（G（z）））：
在这里插入图片描述 <

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI强仔 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。