生成对抗网络(GAN)全面解析:从基础到StyleGAN
1. GAN基础概述
生成对抗网络(GAN)的核心目标是学习一个生成器网络,该网络能够将随机噪声转化为与训练集难以区分的数据。为实现这一目标,生成器会与一个判别器网络共同训练,判别器的任务是区分真实样本和生成样本。生成器会不断更新,以使判别器将其生成的数据识别为更“真实”的样本。然而,原始的GAN公式存在一个缺陷,即当容易判断样本是真实还是生成时,训练信号会变弱,这促使了Wasserstein GAN的出现,它能提供更稳定的训练信号。
2. 不同类型的GAN及其应用
- 卷积GAN :主要用于生成图像,并且有一系列技巧可以提高生成图像的质量,例如渐进式增长、小批量判别和截断等。
- 条件GAN :引入了一个辅助向量,允许对输出进行控制,例如选择对象类别。在图像翻译任务中,这种条件信息以图像的形式保留,但不再需要随机噪声。此时,GAN判别器作为一个额外的损失项,有助于生成更“逼真”的图像。
- CycleGAN :其损失函数是三种损失的加权和,包括内容损失、对抗损失和循环一致性损失。内容损失基于ℓ1范数,促使前后图像相似;对抗损失使用判别器,使输出与目标域的真实示例难以区分;循环一致性损失则鼓励映射是可逆的。通过同时训练两个模型,一个从一个域映射到另一个域,另一个则进行相反的映射,实现图像风格的双向转换。
- StyleGAN :是一种更现代的GAN,它将数据集中的变化划分为有意义的组件,每个组件由一部
超级会员免费看
订阅专栏 解锁全文
48

被折叠的 条评论
为什么被折叠?



