生成对抗网络(GAN)在计算机视觉中的应用与发展

在当今的深度学习领域,数据生成方法广泛应用于从计算机视觉到自然语言处理等众多现代深度学习应用中。目前,我们已经能够生成几乎可以以假乱真的生成数据。而生成学习大致可分为两个主要类别:变分自编码器(VAE)和生成对抗网络(GAN)。

为何不只用自编码器

很多人会疑惑,为什么研究人员要使用复杂的GAN,而不直接使用自编码器并最小化均方误差,使预测图像与目标图像匹配呢?原因在于,这些模型在图像生成方面效果不佳。仅仅最小化距离会因平均化而产生模糊的预测,因为L1或L2损失是一个标量,是所有像素的平均量,这就如同应用了一个基于平均值对像素值进行平均的平滑滤波器。此外,这种方式无法产生多样性,而GAN模型则弥补了这些不足。

什么是对抗学习

深度学习模型在测试时,对基于输入的微小修改的攻击非常脆弱。例如,一个训练好的分类器能正确识别图像中的物体并给出正确标签,但可以构造出一个视觉上几乎无法区分的对抗性示例,通过噪声扰动构造的这些对抗性图像却会被错误分类。为解决这个问题,常见的方法是将对抗性示例注入训练集进行对抗训练,以提高神经网络的鲁棒性。但这些技术有点需要人工干预,总会有不同的扰动可以用来欺骗分类器。换个角度想,如果我们不关注让分类器更鲁棒,而是想取代人工构造对抗性示例的过程,让网

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值