利用GAN进行图像生成:原理与实践
1. 图像生成与GAN简介
图像生成比图像分类更具挑战性,无论是对于人类还是计算机而言。2014年,Ian Goodfellow及其同事发表了题为“Generative adversarial nets”的论文后,基于生成对抗网络(GAN)的许多算法应运而生。如今,计算机能够被训练生成逼真的人脸照片,只需搜索“this person does not exist”,就能看到令人惊叹的虚假人脸照片。
GAN由两个神经网络或模型组成:生成器(Generator)和判别器(Discriminator)。生成器从纯噪声中创建虚假数据样本,判别器则以虚假样本和真实样本作为输入,评估并找出虚假样本。在模型训练过程中,这两个网络相互竞争。生成器试图生成数据(图像)来欺骗判别器,而判别器则努力正确识别生成的数据。训练过程会持续进行,直到生成器生成的数据逼真到判别器无法区分其与真实数据。在模型训练结束时,GAN可以找到数据集中图像像素的概率密度函数(PDF),利用该PDF的参数,计算机就能生成与真实图像相似的虚假图像。
2. GAN理论
2.1 生成器与判别器模型
一个GAN模型作为生成器(G),它被训练从一维噪声向量生成虚假图像。噪声向量的元素数量可以是1、2,甚至超过100,这些向量来自标准正态分布函数。模型G有许多参数(dg)需要训练。另一个模型作为判别器(D),它被训练区分数据集中的虚假图像和真实图像,同样有许多参数(d)需要训练。
可以将模型G类比为一个艺术学生,模型D则是他的老师,如达芬奇。学生在观看老师的许多杰作后画出第一幅画,老师指出学生画得不正确的地方,并告知如何提高绘画技巧。
超级会员免费看
订阅专栏 解锁全文
2336

被折叠的 条评论
为什么被折叠?



