昇思MindSpore学习总结十九 —— GAN图像生成

最新推荐文章于 2024-07-28 22:27:54 发布

原创

最新推荐文章于 2024-07-28 22:27:54 发布 · 926 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#学习 #python #mindspore #生成对抗网络

1、模型简介

生成式对抗网络(Generative Adversarial Networks，GAN)是一种生成式机器学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。

最初，GAN由Ian J. Goodfellow于2014年发明，并在论文Generative Adversarial Nets中首次进行了描述，其主要由两个不同的模型共同组成——生成器(Generative Model)和判别器(Discriminative Model)：

生成器的任务是生成看起来像训练图像的“假”图像；
判别器需要判断从生成器输出的图像是真实的训练图像还是虚假的图像。

GAN通过设计生成模型和判别模型这两个模块，使其互相博弈学习产生了相当好的输出。

GAN模型的核心在于提出了通过对抗过程来估计生成模型这一全新框架。在这个框架中，将会同时训练两个模型——捕捉数据分布的生成模型 𝐺 和估计样本是否来自训练数据的判别模型 𝐷 。

在训练过程中，生成器会不断尝试通过生成更好的假图像来骗过判别器，而判别器在这过程中也会逐步提升判别能力。这种博弈的平衡点是，当生成器生成的假图像和训练数据图像的分布完全一致时，判别器拥有50%的真假判断置信度。

用 𝑥 代表图像数据，用 𝐷(𝑥)表示判别器网络给出图像判定为真实图像的概率。在判别过程中，𝐷(𝑥) 需要处理作为二进制文件的大小为 1×28×28 的图像数据。当 𝑥 来自训练数据时，𝐷(𝑥) 数值应该趋近于 1 ；而当 𝑥 来自生成器时，𝐷(𝑥) 数值应该趋近于 0 。因此 𝐷(𝑥) 也可以被认为是传统的二分类器。

用 𝑧 代表标准正态分布中提取出的隐码(隐向量)，用 𝐺(𝑧)：表示将隐码(隐向量) 𝑧 映射到数据空间的生成器函数。函数 𝐺(𝑧) 的目标是将服从高斯分布的随机噪声 𝑧 通过生成网络变换为近似于真实分布 𝑝𝑑𝑎𝑡𝑎(𝑥) 的数据分布，我们希望找到 θ 使得 𝑝𝐺(𝑥;𝜃)和 𝑝𝑑𝑎𝑡𝑎(𝑥)尽可能的接近，其中 𝜃 代表网络参数。

𝐷(𝐺(𝑧))表示生成器 𝐺 生成的假图像被判定为真实图像的概率，如Generative Adversarial Nets中所述，𝐷 和 𝐺 在进行一场博弈，𝐷 想要最大程度的正确分类真图像与假图像，也就是参数 log𝐷(𝑥)；而 𝐺 试图欺骗 𝐷 来最小化假图像被识别到的概率，也就是参数 log(1−𝐷(𝐺(𝑧)))。因此GAN的损失函数为：