生成对抗网络合成新数据
1. 简单GAN模型回顾与DCGAN引入
在之前的简单GAN模型训练中,随着训练推进,生成网络生成的图像越来越逼真,但即便经过100个训练周期,生成的图像与MNIST数据集中的手写数字仍有很大差异。该简单GAN模型的生成器和判别器仅包含一个全连接隐藏层,虽然取得了一定成果,但并不令人满意。
由于在图像分类任务中,带有卷积层的神经网络架构相较于全连接层有诸多优势,因此我们可以在GAN模型中加入卷积层来处理图像数据,以提升效果。接下来,我们将实现深度卷积生成对抗网络(DCGAN),其生成器和判别器网络均使用卷积层。
同时,为进一步提升性能,我们还会采用一些关键技术并实现Wasserstein生成对抗网络(WGAN),这些技术包括:
- 转置卷积
- 批量归一化(BatchNorm)
- WGAN
- 梯度惩罚
2. 转置卷积
转置卷积通常用于对特征空间进行上采样,而普通卷积操作常用于下采样特征空间(例如通过设置步长为2或在卷积层后添加池化层)。
为理解转置卷积操作,我们进行一个简单的思想实验。假设有一个大小为$n×n$的输入特征图,对其应用具有特定填充和步长参数的二维卷积操作,得到大小为$m×m$的输出特征图。那么,如何通过另一个卷积操作从这个$m×m$的输出特征图恢复到初始维度$n×n$的特征图,同时保持输入和输出之间的连接模式呢?需要注意的是,转置卷积仅恢复特征空间的维度,而非实际值。
转置卷积也被称为分数步长卷积,在深度学习文献中,另一个常用术语是反卷积。但反卷积最初被定义为卷积操作的逆操作,而转置卷积仅关注恢复特征空间的维度。 <
超级会员免费看
订阅专栏 解锁全文
2899

被折叠的 条评论
为什么被折叠?



