生成对抗网络（GAN）在计算机视觉中的应用与发展

t0_54program

于 2025-04-12 15:13:16 发布

阅读量185

点赞数 5

分类专栏：大数据与人工智能文章标签：生成对抗网络计算机视觉人工智能个人开发

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2501_90323865/article/details/147165796

版权

大数据与人工智能专栏收录该内容

164 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

在当今的深度学习领域，数据生成方法广泛应用于从计算机视觉到自然语言处理等众多现代深度学习应用中。目前，我们已经能够生成几乎可以以假乱真的生成数据。而生成学习大致可分为两个主要类别：变分自编码器（VAE）和生成对抗网络（GAN）。

为何不只用自编码器

很多人会疑惑，为什么研究人员要使用复杂的GAN，而不直接使用自编码器并最小化均方误差，使预测图像与目标图像匹配呢？原因在于，这些模型在图像生成方面效果不佳。仅仅最小化距离会因平均化而产生模糊的预测，因为L1或L2损失是一个标量，是所有像素的平均量，这就如同应用了一个基于平均值对像素值进行平均的平滑滤波器。此外，这种方式无法产生多样性，而GAN模型则弥补了这些不足。

什么是对抗学习

深度学习模型在测试时，对基于输入的微小修改的攻击非常脆弱。例如，一个训练好的分类器能正确识别图像中的物体并给出正确标签，但可以构造出一个视觉上几乎无法区分的对抗性示例，通过噪声扰动构造的这些对抗性图像却会被错误分类。为解决这个问题，常见的方法是将对抗性示例注入训练集进行对抗训练，以提高神经网络的鲁棒性。但这些技术有点需要人工干预，总会有不同的扰动可以用来欺骗分类器。换个角度想，如果我们不关注让分类器更鲁棒，而是想取代人工构造对抗性示例的过程，让网

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。