CONDITIONAL IMAGE SYNTHESIS WITH AUXILIARY CLASSIFIER GANS

最新推荐文章于 2024-10-02 22:48:41 发布

原创

最新推荐文章于 2024-10-02 22:48:41 发布 · 2.7k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#ACGAN #机器学习 #图像合成 #生成对抗网络 #图像高分辨率

本文提出了一种改进的GANs训练方法——ACGAN，用于生成128×128分辨率的类条件图像，提高了图像的全球一致性。通过定量分析，表明高分辨率样本具有更高的可区分性和多样性，且与真实ImageNet数据相比，84.7%的类别具有相似的样本表达多样性。

论文下载地址：这里

[目录]

摘要

合成高分辨率图像是机器学习中一个长期存在的挑战，文中介绍了图像合成的一个改进训练GAN s的新方法。我们运用标签条件构建了一个变种GANs，产生显示出全局一致性的128×128分辨率的图像样本。我们扩展了以前的图像质量评价工作，提出了两种新的分析方法，以评价类别条件图像合成模型的样本的可区分性和多样性。这些分析表明，高分辨率样本提供了在低分辨率样本中不存在的类别信息。在1000个ImageNet类中，128×128的样本比人工调整的32×32 大小的样本高出两倍的可分性。并且，84.7%的类别具有与真实ImageNet 数据可比拟的样本表达多样性

简介

表征自然图像结构是个极富研究的工作，自然图像服从内在不变性，并展现出史上难以量化的多尺度统计结构。机器学习的最新进展提供了一个大幅度提高图像模型质量的机会。改进的图像模型在图像去噪，压缩，绘图，和超分标率上都提升了目前的先进水平。更好的自然图像模型还可以提高版半督学习任务和强化学习问题的性能。
理解自然图像统计的方法之一是建立一个合成图像的系统 de novo。建立图像合成模型有几个有前景的方法。变量自编码器（ Variational autoencoders (VAEs)）最大化训练数据的对数似然变化的下限。VAEs直接训练但引入了潜在的近似后验分布的限制性假设。自回归模型不考虑潜在（隐藏）变量，直接在像素空间上对条件分布进行建模。这些模型产生极具说服力的样本但从中采样的代价很昂贵，并且不提供隐藏表达式。可逆密度估计器用一系列被约束成可逆的参数化函数直接转化隐含变量，此技术允许精确的对数似然计算和精确推理，但是可逆性约束是限制性的。生成对抗网络提供了一个独特而又富有前景的方法，重点是用于训练图像合成模型的游戏理论公式。最近的工作表明，GANs可以在具有低可变性和低分辨率的数据集上生成令人信服的图像样本。然而，GANs致力于生成全局一致的，高分辨率样本，特别是来自具有高可变性的数据集。此外，对GANs的理论认识也是一个持续的研究课题。
本工作中，我们证明，为GAN隐藏空间增加更多结构和专门的成本函数可以获得高质量的样本，我们展示了来自ImageNet数据集所有类