PyTorch深度学习项目：生成对抗网络(GAN)原理与实践-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00052/article/details/148465508

PyTorch深度学习项目：生成对抗网络(GAN)原理与实践

NYU-DLSP20 NYU Deep Learning Spring 2020 项目地址: https://gitcode.com/gh_mirrors/pyt/pytorch-Deep-Learning

生成对抗网络基础概念

生成对抗网络(GAN)是一种用于无监督学习的神经网络架构，由两个对抗性模块组成：生成器网络和成本网络（或称判别器网络）。这两个模块相互竞争，形成一种独特的训练机制。

核心架构解析

GAN的核心架构包含两个关键组件：

生成器网络：负责从随机噪声向量生成假数据样本
成本网络：负责区分真实数据样本和生成器产生的假样本

这两个网络在训练过程中不断对抗竞争：

成本网络试图准确识别出假样本
生成器则试图生成越来越逼真的样本来欺骗成本网络

通过这种对抗过程，最终训练出的生成器能够产生高度逼真的数据样本。GAN在图像生成、未来预测等任务中表现出色。

能量模型视角

从能量模型(EBM)的角度来看，成本网络被训练为：

对接近真实数据分布（图2中粉色x）的输入产生低成本
对其他分布（图2中蓝色x̂）的输入产生高成本

成本函数通常使用均方误差(MSE)损失来计算，输出范围为非负实数。这与传统分类器不同，后者输出离散的分类结果。

GAN与VAE的对比分析

架构差异

变分自编码器(VAE)和GAN在生成数据的方式上有本质区别：

VAE工作流程：
- 编码器将输入x映射到潜在空间Z
- 解码器从Z映射回数据空间得到x̂
- 使用重构损失使x和x̂尽可能相似
GAN工作流程：
- 直接从潜在空间Z采样
- 生成器将z映射为x̂
- 通过判别器评估x̂的"真实性"
- 不需要直接测量x̂与x的关系

关键区别

GAN与VAE最显著的区别在于：

VAE需要明确的x与x̂之间的重构损失
GAN通过对抗训练间接确保x̂接近x，使判别器对x̂的评分接近真实数据

GAN训练中的主要挑战

尽管GAN功能强大，但在实际训练中存在几个关键挑战：

1. 收敛不稳定

随着生成器性能提升，判别器性能会下降，因为区分真假数据变得更困难。当生成器接近完美时，判别器会给出随机反馈，导致生成器训练崩溃。

2. 梯度消失问题

使用二元交叉熵损失时，当判别器过于自信，梯度会进入平坦区域变得饱和，导致生成器训练受阻。解决方案是确保成本随置信度平稳增长。

3. 模式崩溃问题

生成器可能将所有z映射到单一x̂来欺骗判别器，导致输出缺乏多样性。解决方法是对生成器施加惩罚，确保不同输入产生不同输出。

DCGAN实现详解

深度卷积生成对抗网络(DCGAN)是GAN的一种改进架构，特别适合图像生成任务。

生成器实现

生成器使用转置卷积层(ConvTranspose2d)进行上采样：

输入是随机噪声向量(nz维)
通过多个转置卷积层逐步扩大特征图尺寸
使用批量归一化和ReLU激活
最终输出使用Tanh激活，范围在(-1,1)
输出尺寸为nc×64×64（nc为通道数）

class Generator(nn.Module):
    def __init__(self):
        super().__init__()
        self.main = nn.Sequential(
            nn.ConvTranspose2d(nz, ngf*8, 4, 1, 0, bias=False),
            nn.BatchNorm2d(ngf*8),
            nn.ReLU(True),
            # 更多层...
            nn.Tanh()
        )

判别器实现

判别器使用常规卷积层：

输入是图像(nc×64×64)
使用LeakyReLU保留负区域梯度
逐步下采样特征图
最终使用Sigmoid输出分类概率

class Discriminator(nn.Module):
    def __init__(self):
        super().__init__()
        self.main = nn.Sequential(
            nn.Conv2d(nc, ndf, 4, 2, 1, bias=False),
            nn.LeakyReLU(0.2, inplace=True),
            # 更多层...
            nn.Sigmoid()
        )