生成式对抗网络（Generative Adversarial Networks, GANs）

最新推荐文章于 2025-04-14 10:45:34 发布

原创

最新推荐文章于 2025-04-14 10:45:34 发布

· 2.1k 阅读

6 ·

版权

本文详细介绍了生成式对抗网络（GANs）的结构、训练过程、训练模型及其存在的问题。GANs由生成器和判别器组成，通过对抗学习提升生成样本的质量。文章还探讨了GANs的训练模型，包括Wasserstein距离的WGAN、卷积神经网络应用的DCGAN，以及ALI、IRGAN和SeqGAN等变种。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 原始的 GANs

1.1 GANs 的结构

GANs 的结果图如下所示：

在这里插入图片描述

生成式对抗网络 GANs 最重要的两个部分为：

生成器（Generator） ：用于生成“假”样本。生成器从先验分布中采得随机信号，经过神经网络的变换，得到模拟样本。
判别器（Discriminator） ：用于判断输入的样本是真实的还是合成的。判别器既接收来自实际数据集的真实样本，也接收来自生成器的模拟样本，判别器需要判断输入的样本是真实数据还是生成器的模拟（假）数据。

从上面可以看出，生成器和判别器是对抗的关系，生成器要尽可能生成出让判别器失败的样本，而判别器要尽可能识别出生成器的假样本。GANs 就是通过这种对抗的关系，让生成器和判别器不断提升。理想状态下，生成器和判别器最终能达到一种平衡，两者都趋于完美，都没有更进一步的空间。

1.2 GANs 的训练过程

GANs 采用生成器和判别器交替优化的方式：

（1）固定生成器 $G$ ，训练判别器 $D$

固定生成器 $G$ ，然后利用生成器随机模拟产生样本 $G (z)$ 作为负样本（ $z$ 是一个随机向量），并从真实数据集中采样获得正样本 $X$ ，将这些正负样本输入到判别器 $D$ 中，根据判别器的输出（即 $D (X)$ 或 $D (G (z))$ ）和样本标签来计算误差，最后利误差反向传播算法来更新判别器的参数，如下图所示

在这里插入图片描述

（2）固定判别器 $D$ ，训练生成器 $G$

固定判别器 $D$ ，然后利用当前生成器 $G$ 随机模拟产生样本 $G (z)$ ，并输入到判别器 $D$ 中；根据判别器的输出 $D (G (z))$ 和样本标签来计算误差，最后利用误差反向传播算法来更新生成器 $G$ 的参数，如下图所示：

在这里插入图片描述

1.3 GANs 的训练模型

先给出 GANs 的公式：

$\min_G \max_D V(D,G)=E_{x\sim p_{data}(x)}[\log D(x)] + E_{z\sim p_{z}(z)}[\log D(G(z))] \tag{1}$

训练模型中需要用到的符号有：

$G$ ：生成器模型，通常为一个多层感知机结构的可微函数
$D$ ：判别器模型
$x$ ：判别器的输入，包括真实数据样本和生成器的输出
$z$ ：生成器输入的噪声变量，则生成器的输出为 $x = G (z)$
$p_{data}(x) \doteq p(x|data)$ ：表示从实际数据集得到样本 $x$ 的概率
$p_{z}(z)$ ：生成器输入的噪声变量 $z$ 的先验分布
$p_{g}(x) \doteq p(x|g)$ ：生成器输出的样本 $x$ 的概率
$p_{src}(data)$ 与 $p_{src}(g)$ ：判别器模型输入样本中来自真实数据和来自生成器的概率，一般采用一半真实数据、一半假数据的方式，即： $p_{src}(data)=p_{src}(g)=\frac{1}{2}$
$G(z;\theta_g)$ ： $\theta_g$ 为生成器的多层感知机的参数， $G(z;\theta_g)$ 代表生成器模型的输出空间
$D(x;\theta_d)$ ： $\theta_d$ 为判别器的多层感知机的参数， $D(x;\theta_d)$ 为判别器的输出，是一个标量值
$D (x)$ ：判别器预测输入样本 $x$ 来自于真实数据集的概率
$G^*,D^*)$ ：求得的解，即达到最终纳什均衡点时的生成器和判别器