深度学习中的图像生成技术探索
1. 神经风格迁移
神经风格迁移算法运行速度较慢,但它所进行的转换操作相对简单,只要有合适的训练数据,一个小型快速的前馈卷积网络也能学习到这种转换。实现快速风格迁移的步骤如下:
1. 利用特定方法,花费大量计算周期为固定的风格参考图像生成输入 - 输出训练示例。
2. 训练一个简单的卷积网络,使其学习这种特定风格的转换。
3. 完成训练后,对给定图像进行风格化处理只需通过这个小型卷积网络进行一次前向传播即可。
风格迁移的要点总结如下:
- 风格迁移是创建一幅新图像,在保留目标图像内容的同时捕捉参考图像的风格。
- 内容可以通过卷积网络的高层激活来捕捉。
- 风格可以通过卷积网络不同层激活的内部相关性来捕捉。
- 深度学习可将风格迁移表述为使用预训练卷积网络定义的损失进行的优化过程。
- 基于这个基本思想,还可以有许多变体和改进。
2. 基于图像潜在空间的图像生成
2.1 图像潜在空间采样
图像生成的关键在于构建一个低维的潜在表示空间(自然是一个向量空间),该空间中的任何点都能映射到一张逼真的图像。能够实现这种映射的模块,在生成对抗网络(GANs)中称为生成器,在变分自编码器(VAEs)中称为解码器。
GANs和VAEs是学习图像表示潜在空间的两种不同策略,它们的特点对比如下:
| 方法 | 特点 |
| ---- | ---- |
| VAEs | 适合学习结构良好的潜在空间,特定方向编码数据中有意义的变化轴。 |
| GANs | 能够生成高度逼真的单帧图像,但潜
超级会员免费看
订阅专栏 解锁全文
4896

被折叠的 条评论
为什么被折叠?



