生成对抗网络(GAN):原理、实现与训练
1. 生成对抗网络简介
生成对抗网络(GAN)由Goodfellow等人在2014年提出,是学习图像潜在空间的一种替代变分自编码器(VAEs)的方法。它通过迫使生成的图像在统计上与真实图像几乎无法区分,从而生成相当逼真的合成图像。
1.1 直观理解GAN
可以将GAN想象成一个伪造者试图创作一幅假的毕加索画作。起初,伪造者并不擅长此任务。他将一些赝品与真品毕加索画作混在一起,展示给一位艺术经销商。艺术经销商对每幅画作进行真伪评估,并向伪造者反馈毕加索画作的特征。伪造者回到工作室准备新的赝品。随着时间的推移,伪造者越来越擅长模仿毕加索的风格,而艺术经销商也越来越擅长辨别赝品。最终,他们手中就有了一些出色的假毕加索画作。
1.2 GAN的组成部分
GAN由两部分组成:
- 生成器网络 :以随机向量(潜在空间中的随机点)为输入,并将其解码为合成图像。
- 判别器网络(或对手) :以图像(真实或合成)为输入,并预测该图像是来自训练集还是由生成器网络创建的。
生成器网络的训练目标是欺骗判别器网络,因此随着训练的进行,它会逐渐生成越来越逼真的图像,以至于判别器网络无法区分真假图像。同时,判别器会不断适应生成器能力的逐渐提升,为生成的图像设定高逼真度标准。训练结束后,生成器能够将其输入空间中的任何点转换为可信的图像。与VAEs不同,GAN学习的潜在空间没有明确的有意义结构保证,特别是它不是连续的。
1.3 GAN的优化特点
与本书中遇到的其他训练设
超级会员免费看
订阅专栏 解锁全文
3367

被折叠的 条评论
为什么被折叠?



