生成对抗网络(GAN)入门指南
1. 生成图像的主要工具
深度学习中的图像生成是通过学习潜在空间来实现的,潜在空间捕捉了图像数据集的统计信息。通过从潜在空间中采样和解码点,我们可以生成前所未见的图像。主要有两种工具可用于此目的:变分自编码器(VAEs)和生成对抗网络(GANs)。
1.1 VAEs 和 GANs 的特点
- VAEs :能产生高度结构化、连续的潜在表示。因此,它们非常适合在潜在空间中进行各种图像编辑,如面部交换、将皱眉脸变为笑脸等。它们也适用于基于潜在空间的动画制作,例如沿着潜在空间的横截面进行动画展示,或让起始图像逐渐连续地演变成不同的图像。
- GANs :能够生成逼真的单帧图像,但可能无法诱导出具有坚实结构和高连续性的潜在空间。在实际应用中,大多数成功的图像相关应用依赖于 VAEs,但 GANs 在学术研究领域一直很受欢迎。
2. 生成对抗网络(GANs)概述
2.1 GANs 的原理
GANs 由生成器网络和判别器网络组成,这两个网络相互对抗训练。可以将其类比为一个伪造者试图创作一幅假的毕加索画作,以及一位艺术经销商试图辨别画作真伪的过程。
- 生成器网络 :将随机向量(潜在空间中的随机点)作为输入,并将其解码为合成图像。
- 判别器网络(或对手) :将图像(真实或合成)作为输入,并预测该图像是来自训练集还是由生成器网络创建的。
GAN入门与实践:图像生成与优化
超级会员免费看
订阅专栏 解锁全文
入门指南&spm=1001.2101.3001.5002&articleId=151034469&d=1&t=3&u=9d6adb121c32485f8146598d8a579bcd)
273

被折叠的 条评论
为什么被折叠?



