极简笔记 A Variational U-Net for Conditional Appearance and Shape Generation 本文利用条件变分自编码器(CVAE),输入一张人体图片和目标姿态,生成目标姿态的合成人体图片,并保留原图的appearance信息。 记输入图片xxx, 姿态信息yyy, 表观信息zzz, 网络结构如下图: VAE部分通过输入图像和图像中对应姿态学习appearance的分布q(z∣x,y^)q(z|x,\hat{y})q</