深度学习图像生成:从风格迁移到变分自编码器
1. 神经风格迁移
神经风格迁移旨在创建新图像,保留目标图像的内容,同时捕捉参考图像的风格。不过,运行风格迁移算法速度较慢。但该算法执行的转换足够简单,只要有合适的训练数据,小型快速的前馈卷积网络也能学习这种转换。
实现快速风格迁移的步骤如下:
1. 利用特定方法,为固定的风格参考图像生成大量输入 - 输出训练示例,这需要消耗大量计算资源。
2. 训练一个简单的卷积网络,使其学习这种特定风格的转换。
3. 训练完成后,对给定图像进行风格化处理只需通过这个小型卷积网络进行一次前向传播,瞬间即可完成。
风格迁移的要点总结如下表:
|要点|详情|
|----|----|
|目标|创建保留目标图像内容并捕捉参考图像风格的新图像|
|速度问题|原始算法运行慢|
|解决方法|训练小型前馈卷积网络学习转换|
|快速风格化|训练后通过前向传播瞬间完成|
2. 图像生成概述
通过深度学习进行图像生成,主要是学习能够捕捉图像数据集统计信息的潜在空间。通过从潜在空间采样并解码点,可以生成前所未见的图像。目前主要有两种工具用于此任务:变分自编码器(VAEs)和生成对抗网络(GANs)。
图像生成的关键思想是构建一个低维的潜在表示空间(自然是向量空间),其中任何点都可以映射到逼真的图像。能够实现这种映射的模块,在GANs中称为生成器,在VAEs中称为解码器。一旦开发出这样的潜在空间,就可以从其中采样点,通过将其映射到图像空间,生成新图像。
VAEs和GANs的特点对比如下:
|方法
超级会员免费看
订阅专栏 解锁全文
605

被折叠的 条评论
为什么被折叠?



