DCGAN学习笔记

最新推荐文章于 2025-03-31 08:43:32 发布

LouisD5Luka

最新推荐文章于 2025-03-31 08:43:32 发布

阅读量437

点赞数

文章标签：深度学习神经网络 generator

本文链接：https://blog.youkuaiyun.com/LouisD5Luka/article/details/103559350

版权

这篇笔记详细介绍了DCGAN（深度卷积生成对抗网络）的学习过程，包括Celeba数据集的读取、GAN的基本原理以及DCGAN的架构。文章中提到，DCGAN由生成器和判别器组成，使用了Batchnorm、LeakyReLU和Tanh/ReLU激活函数，并解释了转置卷积的padding机制。此外，还分析了GAN的损失函数和训练策略，即分别固定生成器和判别器进行交替训练。最后，作者计划深入研究R-CNN和YOLO系列的深度学习应用，特别是YOLOv3的实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DCGAN学习笔记

2019.12.10——2019.12.12

celeba数据集读取
GAN原理
DCGAN架构

这是在Pytorch官网上看到的一个项目，可作为通过理解GAN的入门：DCGAN TUTORIAL

数据集读取

import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
from torchvision.transforms import transforms
import torchvision.datasets as datasets
import torchvision.utils as vutils


dataroot = '.\celeba'
image_size = 64
dataset = datasets.ImageFolder(root=dataroot,
								transform=transforms.Compose([transforms.Resize(image_size),
								transforms.CenterCrop(image_size),
								transforms.ToTensor(),
								transforms.Normalize((0.5, 0.5, 0.5),(0.5, 0.5, 0.5)),]))
dataloader = torch.utils.data.Dataloader(dataset, batch_size=128, shuffle=True)

GAN原理简述

Generative Adversarial Network（简称GAN)，是一种生成网络，由两个神经网络组成，一个是生成器网络（Generator）,另一个是判别器网络（Discriminator）,在DCGAN架构中，有：

Batchnorm——generator——discriminator ——except the output of the former one and the input of the later one(normalize input to have zero mean and unit variance)
In generator——activation—— output layer:Tanh——others:ReLU
In discriminator——activation——output layer:Sigmoid——others:LeakyReLU

PS: nn.ConvTranspose2d(inplanes, outplanes, kernel_size, stride, padding)的补零机制需要注意下，有别于nn.Conv2d在矩阵外围直接补padding数量的零，转置卷积padding可分为内外两层，输入元素行列间:
$padding_{1} = (H_{in} - 1) * (stride - 1)$
其中， $H_{in}$ 为输入维度，此处为Height的维度。