Perceptual Losses for Real-Time Style Transfer and Super-Resolution

最新推荐文章于 2025-06-18 01:00:00 发布

蹦跶的小羊羔

最新推荐文章于 2025-06-18 01:00:00 发布

阅读量2.3k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Deep Learning 文章标签：风格迁移

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yql_617540298/article/details/87922641

本文探讨了使用感知损失函数在实时风格转换和超分辨率重建中的应用。通过对比逐像素损失函数的不足，提出采用预训练的VGG-16网络提取高级特征来定义感知损失。实验结果显示，这种方法在风格转换和超分辨率任务中能产生高质量图像，且速度提升了三个数量级。

(基于感知损失函数的实时风格转换和超分辨率重建)

一、概述

1. 图像转换问题：将一个输入图像变换成一个输出图像。

(1)流行的处理方法：图像转换的方法通常是训练前馈卷积神经网络，将输出图像与原本图像的逐像素差距作为损失函数。

(2)并行工作表示，高质量的图像可以通过用预训练好的网络提取高级特征、定义并优化感知损失函数来产生。

(3)结合以上两种方式的优点：

本文提出采用感知损失函数训练前馈网络进行图像转换的任务。

实验任务：

①图像风格化

②单图的超分辨率重建

实验结果：

①图像风格化，训练一个前馈网络去解决实时优化问题（Gatys等人提出的），和基于有优化的方法对比，网络产生质量相当的结果，却能做到三个数量级的提速；

②实验了单图的超分辨率重建，同样采用感知损失函数来代替求逐像素差距的损失函数。

2. 图像转换任务：

(1) 图像处理：图像降噪，超分辨率重建，图像上色，这都是输入一个退化的图像（噪声，低分辨率，灰度），输出一个高质量的彩色图像；

(2) 计算机视觉：语义分割，深度估计，其中的输入是一个彩色图像，输出是图像对场景的语义或几何信息进行了编码。

一个处理图像转换任务的方法是在有监督模式下训练一个前馈卷积神经网络，用逐像素差距作损失函数来衡量输出图像和输入图像的差距。

3. 逐像素求差的损失函数的缺陷

(1)无法抓住输入及输出图像在感知上的差距。

(2)之前，使用逐像素比较的损失函数：即输出图像和真实图像每像素颜色的空间距离，使这个距离最小，这个方法存在弊端：

e.g.有2张基本一样的图像，其中2张图片每个像素相差1，基本视觉效果以及图片结构等都是一致的，但是其计算出来的损失函数却是相差较大的。

(3)目前工作表明：

高质量的图像可以通过建立

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

蹦跶的小羊羔 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。