《生成式深度学习》Generative Deep Learning 第三章 Variational Autoencoders 变分自动编码器

本文深入探讨变分自编码器(VAE),包括自编码器的基础概念,转置卷积的应用,以及VAE如何通过编码器和损失函数的改进实现连续的潜在空间表示。在VAE中,编码器产生均值和方差向量来定义潜在空间中的分布,解码器则使用采样策略从该分布中重构输入图像。损失函数结合了均方误差和KL散度,确保编码后的分布接近标准正态分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 自编码器(Autoencoders,AE):由两部分组成,编码器和解码器。

     编码器:将高维的输入数据压缩为更低维的表征向量(representation vector);

     解码器:将给定的表征向量解压为原始维度。

     自编码器可以用来清除嘈杂的图片,since the encoder learns that it is not useful to capture the position of the random noise inside the latent space.

2. 转置卷积

3. 自编码不保证空间是连续的。比如即使在点(2,-2)可能能解码出好的表示‘4’的图像,但没有任何机制可以确保在点(2.1,-2.1)也能产生好的表示‘4’的图像。损失函数使用RMSE。(自我感觉自编码有点像降维+聚类??)

4. 变分自编码在自编码的基础上做了两点改变:编码器和损失函数

                            

    编码器的改变:不像自编码器里的编码器是直接对应潜在空间中的一个点,变分自编码器里的编码器会将每个输入图像编码到两个向量,mu和log_var,这两个向量共同定义多元正态在潜在空间中的分布。mu:分布的平均点;log_var:每个维度的方差的对数。

     为了将图像编

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值