生成对抗网络(GAN)入门指南与实现解析
1. 生成对抗网络简介
生成对抗网络(GANs)由Goodfellow等人在2014年提出,是学习图像潜在空间的一种替代变分自编码器(VAEs)的方法。它通过使生成的图像在统计上与真实图像几乎无法区分,从而能够生成相当逼真的合成图像。
为了更直观地理解GANs,可以想象一个伪造者试图创作一幅假的毕加索画作。起初,伪造者的技艺很差,他将一些假画与真迹混在一起拿给艺术经销商看。艺术经销商会对每幅画进行真伪评估,并向伪造者反馈毕加索画作的特征。伪造者回到工作室创作新的假画,随着时间推移,伪造者越来越擅长模仿毕加索的风格,而艺术经销商也越来越擅长辨别赝品,最终他们手上会有一些非常逼真的假画。
GANs就如同这个场景,由一个生成器网络和一个判别器网络组成,两者相互训练以超越对方。具体来说:
- 生成器网络 :以随机向量(潜在空间中的随机点)为输入,将其解码为合成图像。
- 判别器网络(或对手) :以图像(真实或合成)为输入,预测该图像是来自训练集还是由生成器网络创建的。
生成器网络的训练目标是欺骗判别器网络,随着训练的进行,它会生成越来越逼真的图像,使得判别器无法区分真假。同时,判别器会不断适应生成器能力的提升,为生成的图像设定更高的逼真度标准。训练结束后,生成器能够将其输入空间中的任何点转换为可信的图像。不过,与VAEs不同,GANs学习的潜在空间没有明确的有意义结构保证,特别是它不是连续的。
GANs是一个优化最小值不固定的系统,与常见的训练设置不同。通常,梯度下降是在静态的损失景观中向下滚动,但对于GANs,
超级会员免费看
订阅专栏 解锁全文
6

被折叠的 条评论
为什么被折叠?



