深度学习系列27:VAE生成模型

总结:
AE(自编码器):编码->n维向量->直接解码
VAE(变分自编码器):编码->n维向量->每个维度使用正态分布拟合->每个维度采样形成新的n维向量->解码
CVAE(条件VAE):每个维度用拟合后的分布均值要和目标图片一致
VQVAE(向量量化自编码器):编码->n维向量->每个维度使用cookbook找到最近向量->解码
注意VQVAE没有采样的过程。

1. AE

AE(Autoencoder),自动编码器。自编码器的初衷是为了数据降维,假设原始特征x维度过高,那么我们希望通过编码器E将其编码成低维特征向量z=E(x),编码的原则是尽可能保留原始信息,因此我们再训练一个解码器D,希望能通过z重构原始信息,即x≈D(E(x)),其优化目标一般是
在这里插入图片描述
我们常用的encoder-decoder即为最简单的一种AE。训练过程中加上一些扰动,就可以变成去噪自编码器(DAE):
在这里插入图片描述

或者用遮盖(MIM,mask image modeling)的方法来加扰动:
在这里插入图片描述

2. VAE

在这里插入图片描述
损失为重构误差+KL散度。
对于每一个样本,需要用神经网络拟合均值 u u u和方差 δ 2 \delta^2 δ2,然后用标准正态分布采样得到Z,然后再恢复成X。其中方差项是核心,是用来进行对抗生成的关键。重构部分误差项会让 u u

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值