GAN文章概述

最新推荐文章于 2025-07-26 15:26:11 发布

蹦跶的小羊羔

最新推荐文章于 2025-07-26 15:26:11 发布

阅读量2.4k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： GAN 文章标签： GAN

本文链接：https://blog.youkuaiyun.com/yql_617540298/article/details/87948368

本文详细介绍了生成对抗网络（GAN）的不同变体，从基础的GAN到DCGAN、InfoGAN、WGAN等，涵盖各种应用场景，如图像生成、图像到图像转换、超分辨率等。每种变体都强调了解决GAN训练中的问题，如稳定性、多样性、无监督学习和对抗性训练。

1. GAN

我们提出了一个通过对抗过程来估计生成模型的新框架，其中我们同时训练两个模型：捕获数据分布的生成模型G和估计样本来自训练数据而不是生成模型概率的判别模型D。对G的训练过程是最大化D出错的概率。这个框架对应于一个极小型双人游戏。在任意函数G和D的空间中，存在唯一的解决方案，其中G恢复训练数据分布并且D等于1/2处。在G和D由多层感知器定义的情况下，整个系统可以通过传播进行训练。在训练或生成样本期间，不需要任何马尔可夫链或展开的近似推理网络。实验通过定性和定量评估生成的样本来证明框架的潜力。

2. DCGAN

近年来，卷积神经网络（CNN）的监督式学习在计算机视觉应用中得到了广泛的应用。相比之下，无监督的CNN学习受到的关注较少。在这项工作中，我们希望能够帮助弥合有监督学习的CNN成功与无视学习之间的差距。我们引入了CNN级别的深度卷积生成对抗网络（DCGAN），它具有一定的架构约束，并且证明它们是非监督学习的有力候选。对各种图像数据集进行训练，我们展示出令人信服的证据，证明我们深层卷积对抗对从发生器和鉴别器中的对象部分到场景学习了表示层次。此外，我们使用学习的功能进行新颖的任务--证明其作为一般图像表示的适用性。

原始GAN训练较为困难、生成器和判别器的loss无法指示训练进程、生成样本缺乏多样性。DCGAN为解决这个问题，对判别器和生成器的架构进行实验枚举，最终找到一组比较好的网络架构设置。

在DCGAN中，比较新颖的实验效果是实现了人脸特征的加减运算：

微笑的女人-自然的女人+自然的男人=微笑的男人

戴眼镜的男人-不戴眼镜的男人+不戴眼镜的女人=戴眼镜的女人

3. InfoGAN

本文描述了InfoGAN，它是对生成敌对网络的信息论扩展，能够以完全无监督的方式学习解耦表示。InfoGAN是一种生成性的对抗性网络，它可以最大化潜在变量的一小部分与观察之间的相互信息。我们推导出可以有效优化的互信息目标的下界。具体而言，InfoGAN成功解开了MNIST数据集中数字形状的书写风格，3D渲染图像的光照姿势以及SVHN数据集中央数字的背景数字。它还发现包括发型，眼镜的存在/不存在以及CelebA脸部数据集上的情绪等视觉概念。实验表明，InfoGAN学习可解释的表示，这些表示与现有监督方法学习的表示相比具有竞争性。

在实验中，InfoGAN实现了数据集的粗细、旋转：