生成对抗网络(GAN):图像与视频合成及增强现实应用的前沿探索
1. GAN 架构的发展历程
1.1 原始 GAN 及其局限性
早期,变分自编码器(VAE)存在生成模糊图像的问题。随后出现的原始生成对抗网络(GAN),也被研究界称为 vanilla GAN,虽有创新,但也有自身局限。Goodfellow 提出的架构中,生成器和判别器都使用多层感知器(MLP),这导致训练不稳定,生成器有时会产生无意义的输出。
1.2 改进架构
- 深度卷积生成对抗网络(DCGAN) :在原始 GAN 提出后不久,DCGAN 被提出。它进行了一系列改进,包括去除全连接隐藏层,使用跨步卷积层替代全连接层,采用批量归一化概念,以及使用 Leaky ReLu 激活函数。
- 条件生成对抗网络(cGAN) :vanilla GAN 对生成内容缺乏控制,生成样本类别不确定,部分训练数据变化可能无法在输出中体现。cGAN 通过让生成器和判别器接受额外信息(如类别标签、文本等),帮助生成特定类别的图像,但要求所有训练数据都有标签,这在处理大型图像数据库时往往难以实现。
- 辅助分类器生成对抗网络(AC - GAN) :为克服 cGAN 的局限,AC - GAN 仅将类别标签输入生成器,判别器需自行学习。判别器输出图像真假概率和类别概率,还能进行半监督学习,即当训练图像无标签时忽略类别标签损失。
- 信息最大化生成对抗网络(InfoGAN) :与 cGAN 不同,Inf
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



