在当今的深度学习领域,数据生成方法广泛应用于从计算机视觉到自然语言处理等众多现代深度学习应用中。目前,我们已经能够生成几乎可以以假乱真的生成数据。而生成学习大致可分为两个主要类别:变分自编码器(VAE)和生成对抗网络(GAN)。
为何不只用自编码器
很多人会疑惑,为什么研究人员要使用复杂的GAN,而不直接使用自编码器并最小化均方误差,使预测图像与目标图像匹配呢?原因在于,这些模型在图像生成方面效果不佳。仅仅最小化距离会因平均化而产生模糊的预测,因为L1或L2损失是一个标量,是所有像素的平均量,这就如同应用了一个基于平均值对像素值进行平均的平滑滤波器。此外,这种方式无法产生多样性,而GAN模型则弥补了这些不足。
什么是对抗学习
深度学习模型在测试时,对基于输入的微小修改的攻击非常脆弱。例如,一个训练好的分类器能正确识别图像中的物体并给出正确标签,但可以构造出一个视觉上几乎无法区分的对抗性示例,通过噪声扰动构造的这些对抗性图像却会被错误分类。为解决这个问题,常见的方法是将对抗性示例注入训练集进行对抗训练,以提高神经网络的鲁棒性。但这些技术有点需要人工干预,总会有不同的扰动可以用来欺骗分类器。换个角度想,如果我们不关注让分类器更鲁棒,而是想取代人工构造对抗性示例的过程,让网