Pytorch之GAN实战

最新推荐文章于 2025-04-06 21:01:12 发布

Hero13146688

最新推荐文章于 2025-04-06 21:01:12 发布

阅读量4.1k

点赞数 2

分类专栏： Pytorch 文章标签：深度学习 pytorch 神经网络

本文链接：https://blog.youkuaiyun.com/weixin_43723467/article/details/104102995

版权

AE,VAE原理

原理（encoder-neck-reconstruct,降维）
- 自动编码机Auto-Encoder (AE)由两部分encoder和decoder组成，encoder输入x数据，输出潜在变量z，decoder输入z然后输出一个x’，目的是让x’与x的分布尽量一致，当两者完全一样时，中间的潜在变量z可以看作是x的一种压缩状态，包含了x的全部feature特征，此时监督信号就是原数据x本身。

在这里插入图片描述

损失函数

在这里插入图片描述

两个变种：
加噪声：防止只学到表层特征，对输入图片添加噪声
dropout：不依赖于所有上层神经元，增加模型鲁棒性
对抗 AE：

想让经过encoder后的数据符合某一分布，防止对于任意的分布都会重建为相同的值，我们可以增加一个discriminator鉴别。

在这里插入图片描述

VAE：变分自编码器
- 变分自动编码机VAE是自动编码机的一种扩展，它假设输出的潜在变量z服从一种先验分布，如高斯分布。这样，在训练完模型后，我们可以通过采样这种先验分布得到z’，这个z’可能是训练过程中没有出现过的，但是我们依然能在解码器中通过这个z’获得x’，从而得到一些符合原数据x分布的新样本，具有“生成“新样本的能力。
- 我们通过两个独立的损失项来优化网络，这两个损失项分别是生成损失和KL散度。其中，生成损失指的是生成图片和目标图片之间的像素值均方差，它描述的是网络重建图片的精度。KL散度描述的则是隐变量和标准正态分布之间的匹配程度。这里有一个trick，让编码网络生成均值向量和标准差向量，而不是直接生成隐变量。

AutoEncoder实战

class AE(nn.Module):
    def __init__(self):
        super(AE, self).__init__()
        # [b, 784] => [b, 20]
        self.encoder = nn.Sequential(
            nn.Linear(784, 256),
            nn.ReLU(),
            nn.Linear(256, 64),
            nn.ReLU(),
            nn.Linear(64, 20),
            nn.ReLU()
        )
        # [b, 20] => [b, 784]
        self.decoder = nn.Sequential(
            nn.Linear(20, 64),
            nn.ReLU(),
            nn.Linear(64, 256),
            nn.ReLU(),
            nn.Linear(256, 784),
            nn.Sigmoid()
        )
    def forward(self, x): 		#param x: [b, 1, 28, 28]
        batchsz = x.size(0)
        # flatten
        x = x.view(batchsz, 784)
        # encoder
        x = self.encoder(x)
        # decoder
        x = self.decoder(x)
        # reshape
        x = x.view(batchsz, 1, 28, 28)
        return x

VAE实战

class VAE(nn.Module):
    def __init__(self):
        super(VAE, self).__init__()
        # [b, 784] => [b, 20]
        # u: [b, 10] 均值
        # sigma: [b, 10] 方差 (采样正态分布) 
        self.encoder = nn.Sequential(
            nn.Linear(784, 256),
            nn.ReLU(),
            nn.Linear(256, 64),
            nn.ReLU(),
            nn.Linear(64, 20),
            nn.ReLU()
        )
        # [b, 20] => [b, 784]
        self.decoder = nn.Sequential(
            nn.Linear(10, 64),
            nn.ReLU(),
            nn.Linear(64, 256),
            nn.ReLU(),
            nn.Linear(256, 784),
            nn.Sigmoid()
        )
        self.criteon = nn.MSELoss()
    def forward(self, x):	#param x: [b, 1, 28, 28]
        batchsz = x.size(0)

最低0.47元/天解锁文章