生成对抗网络(GAN)在图像领域的高级应用
1. GAN简介
生成对抗网络(GAN)是强大的数据生成工具,虽然这里主要关注图像生成,但它也能用于生成其他类型的数据,如表格数据、时间序列数据和音频数据等。不过,GAN比较“挑剔”,通常需要一些技巧来提高其质量和稳定性。
2. 图像到图像的翻译
2.1 基础概念
图像到图像的翻译是指将图像从一个(源)域转换到另一个(目标)域。例如,将马的图像转换为斑马的图像。由于找到配对的图像(如同一场景在冬季和夏季的图像)可能很困难,因此可以创建一种使用非配对图像进行图像到图像翻译的模型架构,虽性能可能不如使用配对图像的模型,但效果也很接近。
2.2 CycleGAN
CycleGAN架构在图12 - 32中用于图像翻译,它比普通GAN更进一步,有两个生成器和两个判别器,它们循环往复工作。以马的图像属于图像域X,斑马的图像属于图像域Y为例(这里是非配对图像):
- 生成器映射 :在图12 - 33(a)中,生成器G将图像域X(马)映射到图像域Y(斑马),生成器F则进行反向映射,即从Y(斑马)到X(马)。这意味着生成器G学习将马的图像映射到斑马图像的权重,生成器F反之。
- 判别器引导 :判别器DX引导生成器F从Y(斑马)到X(马)的良好映射,判别器DY引导生成器G从X(马)到Y(斑马)的良好映射。
- 循环一致性损失 :
- 正向循环一致性损失 :在图12 - 33(b)中,正向循环一致性
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



