VAE与GAN的关系(2)

本文探讨了VAE和GAN两种生成模型的损失函数推导,指出两者可在KL散度统一框架下讨论,并有相似出发点,但因隐变量设计不同导致训练和效果区别。GAN衡量样本与真实数据的分布差异,而VAE关注Auto-Encoder的重构误差。文章提出结合两者的可能性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上文从 KL(q(x,y)p(x,y)) K L ( q ( x , y ) ‖ p ( x , y ) ) 推导出GAN的两个Loss,并给出生成器Loss的正则项设计思路,接下来我们仍从引入隐变量构成联合概率分布角度,推导VAE的Loss。
首先,我们观察 KL(p(x,z)q(x,z)) K L ( p ( x , z ) ‖ q ( x , z ) ) 有:

KL(p(x,z)q(x,z))=KL(p(x)q(x))+p(x)KL(p(z|x)q(z|x))dxKL(p(x)q(x))(1) K L ( p ( x , z ) ‖ q ( x , z ) ) = K L ( p ( x ) ‖ q ( x ) ) + ∫ p ( x ) K L ( p ( z | x ) ‖ q ( z | x ) ) d x ≥ K L ( p ( x ) ‖ q ( x ) ) ( 1 )

KL(p(x,z)q(x,z)) K L ( p ( x , z ) ‖ q ( x , z ) ) KL(p(x)q(x)) K L ( p ( x ) ‖ q ( x ) ) 的上界,优化此上界就达到了优化 KL(p(x)q(x)) K L ( p ( x ) ‖ q ( x ) ) 本身。
对于VAE而言, x x 表示数据样本空间的一个数据点,e.g:MNIST的图片空间是784(28*28)维度空间; z z 表示编码器生成的编码(Code),它是一个多维随机变量,一般为100维,于是有:
1、真实分布: p(x,z)=p(z
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值