生成对抗网络在图像转换与组织学染色中的应用
1. 生成对抗网络基础
生成对抗网络(GAN)由生成器(G)和判别器(D)组成,它们进行一个二人的极小 - 极大博弈以寻求纳什均衡。训练好的判别器 D 会最大化输入分布中图像 x 的概率 D(x)。从先验分布 p(z) 中抽取样本 z 输入到生成器 G,未训练的生成器输出的 G(z) 显然不属于输入分布,会被判别器判定为假图像,即 D(G(z)) 远小于 1。生成器 G 经过训练,使得 D(G(z)) 最大化,最终生成与真实数据分布相符的样本。
2. 原始 GAN 的改进
原始 GAN 虽然比同时期的其他模型有优势,但仍存在一些问题:
- 生成器网络可能不如判别器网络改进得快,导致生成的图像不理想。
- 生成器可能只生成有限类别的样本,即模式崩溃。
- 网络使用反向传播算法训练,需要计算梯度,存在不稳定梯度和消失梯度的问题。
为了解决这些问题,需要进行超参数优化,平衡生成器和判别器的改进速度。同时,也有许多对架构、批量训练和避免模式崩溃的技术改进被提出。
3. 深度卷积生成对抗网络(DCGAN)
DCGAN 由 Radford 等人提出,在从多模态真实世界数据中生成自然图像方面有显著改进。它采取了以下步骤提高效率:
- 使用步幅卷积代替最大池化进行下采样。
- 采用批量归一化确保零均值和单位方差。
- 判别器使用 Leaky ReLU 激活函数。
- 使用 Inception 分数评估效率。
DCGAN 在 ImageNet、人脸和 CIFAR10 数据集上的图像生成有改进,但在医
超级会员免费看
订阅专栏 解锁全文
722

被折叠的 条评论
为什么被折叠?



