利用 infoGAN 与 VAE_GAN 进行图像生成
1. VAE_GAN 图像生成
VAE_GAN 可用于生成不同数据集的假图像,如 Fashion MNIST 和动漫人脸数据集。
- Fashion MNIST 数据集 :图 5.8 展示了真实的 Fashion MNIST 图像以及由 VAE_GAN(z_dim = 256)生成的假图像。可以发现,假图像丢失或模糊了真实图像的详细图案。
- 动漫人脸数据集 :使用 VAE_GAN 代码(z_dim = 128,lr = 1e - 4,epochs = 25)生成假动漫人脸图像。在笔记本电脑上,每个 epoch 约需 8 分钟,设置批量大小为 64,训练 25 个 epoch,模型训练时间约为 210 分钟。若使用 Kaggle 的免费 GPU P100,模型训练时间约为 90 分钟。虽然训练时间较长,但无需浪费时间调整超参数以获取高质量的假图像。图 5.9 中假图像的质量虽不如真实动漫人脸数据集图像,但已足够好。
2. infoGAN 图像生成原理
信息最大化生成对抗网络(infoGAN)是一种无监督计算机视觉技术,无需使用标签即可生成与训练数据集中图像风格相似的特定图像。
- infoGAN 的优势 :普通 GAN 可随机生成逼真的假图像,但条件 GAN 能生成所需的假图像更为重要,因为它可将标签信息与数据集中的图像进行编码。然而,许多数据集未标注,标注成本高昂。变分自编码器可用于无标签数据集生成所需假图像,但生成的假图像通常模糊不清。infoGAN 系统能在模型训练期间自动
infoGAN与VAE_GAN图像生成解析
超级会员免费看
订阅专栏 解锁全文
2338

被折叠的 条评论
为什么被折叠?



