多对抗变分自编码器网络:实现图像生成与分类的同步进行
1. 引言
训练深度神经网络通常需要大量数据,但获取用于图像分类等任务的大规模、准确标注的数据集仍是一项重大挑战。尽管高分辨率图像的产量有了爆发式增长,但监督学习所需的大规模标注数据集仍然稀缺。在医学成像等领域,由于隐私问题,数据集规模往往有限,而且医学专家的标注工作昂贵、耗时,还容易受到主观因素、不一致性和错误的影响。即使有大规模标注数据集可用,它们也常常高度不平衡且分布不均匀,这使得跨多个类别有效训练神经网络变得非常困难。
传统上,小训练数据问题通过简单且繁琐的数据增强方法来缓解,例如通过平移、旋转、翻转等方式创建新的训练样本。缺失或不匹配标签的问题可以通过评估训练样本之间的相似度来解决,但这种方法并不总是可靠,其效果在很大程度上取决于相似度测量算法的性能。
随着变分自编码器(VAEs)和生成对抗网络(GANs)等深度生成模型的出现,从训练样本中学习潜在数据分布在大量无标签数据的常见场景中变得可行。只需最少的标注,高效的半监督学习就可能成为首选方法。具体来说,基于少量标注,学习了真实世界数据分布的模型可以生成逼真的新训练图像,VAEs和GANs都可用于此目的。
VAEs可以学习训练数据的降维表示,并通过显式的密度估计生成新样本。虽然VAEs可以进行快速的变分推理,但生成的样本通常比较模糊。另一方面,尽管GANs在图像生成和半监督分类方面取得了成功,但GAN框架仍然难以训练,存在诸如训练不稳定导致的不收敛、梯度消失问题、过拟合、对超参数敏感以及模式崩溃等挑战。
为了解决这些问题,我们提出了一种新方法,能够同时学习图像生成和多类图像分类。具体而言,我们的工作做出了以下贡献:
1
多对抗变分自编码器网络
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



