[GAN学习系列] 初识GAN

最新推荐文章于 2025-10-26 19:26:06 发布

原创

最新推荐文章于 2025-10-26 19:26:06 发布 · 3.3k 阅读

23 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #GAN #图像合成 #深度学习 #总结

本文深入探讨生成对抗网络（GANs）的基本原理、应用、优缺点及训练技巧，揭示GAN如何在深度学习领域引领潮流，特别是在图像合成、编辑和风格迁移等方面的应用。

本文大约 3800 字，阅读大约需要 8 分钟

要说最近几年在深度学习领域最火的莫过于生成对抗网络，即 Generative Adversarial Networks(GANs)了。它是 Ian Goodfellow 在 2014 年发表的，也是这四年来出现的各种 GAN 的变种的开山鼻祖了，下图表示这四年来有关 GAN 的论文的每个月发表数量，可以看出在 2014 年提出后到 2016 年相关的论文是比较少的，但是从 2016 年，或者是 2017 年到今年这两年的时间，相关的论文是真的呈现井喷式增长。

那么，GAN 究竟是什么呢，它为何会成为这几年这么火的一个研究领域呢？

GAN，即生成对抗网络，是一个生成模型，也是半监督和无监督学习模型，它可以在不需要大量标注数据的情况下学习深度表征。最大的特点就是提出了一种让两个深度网络对抗训练的方法。

目前机器学习按照数据集是否有标签可以分为三种，监督学习、半监督学习和无监督学习，发展最成熟，效果最好的目前还是监督学习的方法，但是在数据集数量要求更多更大的情况下，获取标签的成本也更加昂贵了，因此越来越多的研究人员都希望能够在无监督学习方面有更好的发展，而 GAN 的出现，一来它是不太需要很多标注数据，甚至可以不需要标签，二来它可以做到很多事情，目前对它的应用包括图像合成、图像编辑、风格迁移、图像超分辨率以及图像转换等。

比如字体的转换，在 zi2zi 这个项目中，给出了对中文文字的字体的变换，效果如下图所示，GAN 可以学习到不同字体，然后将其进行变换。

zi2zi_examples

除了字体的学习，还有对图片的转换， pix2pix 就可以做到，其结果如下图所示，分割图变成真实照片，从黑白图变成彩色图，从线条画变成富含纹理、阴影和光泽的图等等，这些都是这个 pix2pixGAN 实现的结果。

pix2pix_examples

CycleGAN 则可以做到风格迁移，其实现结果如下图所示，真实照片变成印象画，普通的马和斑马的互换，季节的变换等。

cycleGAN_examples

上述是 GAN 的一些应用例子，接下来会简单介绍 GAN 的原理以及其优缺点，当然也还有为啥等它提出两年后才开始有越来越多的 GAN 相关的论文发表。

1. 基本原理

GAN 的思想其实非常简单，就是生成器网络和判别器网络的彼此博弈。

GAN 主要就是两个网络组成，生成器网络(Generator)和判别器网络(Discriminator)，通过这两个网络的互相博弈，让生成器网络最终能够学习到输入数据的分布，这也就是 GAN 想达到的目的–学习输入数据的分布。其基本结构如下图所示，从下图可以更好理解G 和 D 的功能，分别为：