达观数据：数据不够？GAN来凑！

原创

于 2019-06-13 18:20:32 发布 · 2.1k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#GAN

大名鼎鼎的深度学习之父Yann LeCun曾评价GAN是“20年来机器学习领域最酷的想法”。的确，GAN向世人展示了从无到有、无中生有的神奇过程，并且GAN已经在工业界有着广泛的应用，是一项令人非常激动的AI技术。今天我将和大家一起去了解GAN及其内部工作原理，洞开GAN的大门。

本文尽量用浅显易懂的语言来进行表述，少用繁琐的数学公式，并对几个典型的GAN模型进行讲解。

一、GAN(GenerativeAdversarial Networks)

GAN全名叫Generative Adversarial Networks，即生成对抗网络，是一种典型的无监督学习方法。在GAN出现之前，一般是用AE（AutoEncoder）的方法来做图像生成的，但是得到的图像比较模糊，效果始终都不理想。直到2014年，Goodfellow大神在NIPS2014会议上首次提出了GAN，使得GAN第一次进入了人们的眼帘并大放异彩，到目前为止GAN的变种已经超过400种，并且CVPR2018收录的论文中有三分之一的主题和GAN有关，可见GAN仍然是当今一大热门研究方向。

GAN的应用场景非常广泛，主要有以下几个方面：

1.图像、音频生成。比如训练数据的生成。

2.图像翻译。从真实场景的图像到漫画风格的图像、风景画与油画间的风格互换等等。

3.图像修复。比如图像去噪、去除图像中的马赛克（嘿嘿…）。

4.图像超分辨率重建。卫星、遥感以及医学图像中用的比较多，大大提升后续的处理精度。

(一) GAN原理简述

GAN的原理表现为对抗哲学，举个例子：警察和小偷的故事，二者满足两个对抗条件：

1.小偷不停的更新偷盗技术以避免被抓。

2.警察不停的发现新的方法与工具来抓小偷。

小偷想要不被抓就要去学习国外的先进偷盗技术，而警察想要抓到小偷就要尽可能的去掌握小偷的偷盗习性。两者在博弈的过程中不断的总结经验、吸取教训，从而都得到稳步的提升，这就是对抗哲学的精髓所在。要注意这个过程一定是一个交替的过程，也就是说两者是交替提升的。想象一下，如果一开始警察就很强大，把所有小偷全部抓光了，那么在没有了小偷之后警察也不会再去学习新的知识了，侦查能力就得不到提升。反之亦然，如果小偷刚开始就很强大，警察根本抓不到小偷，那么小偷也没有动力学习新的偷盗技术了，小偷的偷盗能力也得不到提升，这就好比在训练神经网络时出现了梯度消失一样。所以一定是一个动态博弈的过程，这也是GAN最显著的特性之一。

在讲完了警察与小偷的故事之后，我们引入今天的主人公——GAN。

(二) 模型架构图

从上图能够看出GAN的整个网络架构是非常简单明了的，GAN由一个生成器（Generator）和一个判别器（Discriminator）组成，两者的结构都是多层感知机（MLP），具体有多少层、每层多少个神经元可以根据实际情况自行设计，比较灵活。在这里，生成器充当着“小偷”的角色，判别器就扮演“警察”的角色。为了方便讲解，后面把生成器简称为G，判别器简称为D。

G：接收一个随机噪声向量z（比如z服从高斯分布），G的目标就是通过这个噪声来生成一个像真实样本的假样本。

D：判别一个样本是真实样本还是G自己造的假样本。它接收一个样本数据作为输入，所以这个样本可以是G生成的假样本也可以是真实样本。它输出一个标量，标量的数值代表了输入样本到底是真实样本还是G生成的假样本的概率。如果接近1，则代表是真实样本，接近于0则代表是生成器生成的假样本，所以此时D最后一层的激活函数一定为sigmoid。