基于标签信息的图像生成与图像翻译技术
一、模型评估与风格向量分析
在完成训练后,可运行以下脚本进行模型评估:
(torch)$ python main.py --model infogan --latent_dim 62 --img_size 32 --batch_size 64 --train False
调用 model.eval() 并设置 mode=0 或 mode=1 可以了解风格向量中两个值的作用。第一个风格位( mode=0 )控制数字的角度,第二个风格位( mode=1 )控制笔画的宽度。
二、图像到图像的翻译技术
2.1 像素级标签与图像翻译
在之前,我们学习了使用图像级标签来提升生成对抗网络(GANs)生成图像的质量。而像素级标签在深度学习领域正发挥着越来越重要的作用。例如,语义分割就是像素级标签的一个典型应用,它在自动驾驶汽车中有着重要的应用前景。将原始彩色图像转换为分割图可被视为图像到图像的翻译问题,这一领域还包括风格迁移和图像着色等。
2.2 pix2pix模型介绍
pix2pix是一个经典的图像到图像翻译模型,旨在学习配对图像集合之间的联系,例如将卫星拍摄的航拍照片转换为普通地图,或者将草图转换为彩色图像等。
2.2.1 下载代码与安装依赖
首先,打开终端,使用以下命令下载代码
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



