paper:Generating Images with Perceptual Similarity Metrics based on Deep Networks

本文探讨了深度网络生成图像模糊的原因,指出特征表达的收缩性导致许多图像,包括生成的图像,可以用相同的特征向量表示。为解决此问题,文章提出在合适的特征空间中计算距离,结合自然图像先验和对抗训练,以实现对不相关变换的不变性和对局部图像统计的敏感性,从而生成更逼真的高分辨率图像。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

主要内容:本文主要从传统深度网络生成图片比较模糊出发,分析其原因为图像的details并不能全部的存在于feature中,所以通常loss倾向于平均化所有可能存在细节的locations,导致最后生成的图片blurry,但是准确的locations并不重要,重要的是the distribution of these details,所以希望模型能通过在合适的特征空间中测量距离,实现对不相关变换的不变性和对局部图像统计的敏感性,但是,特征表达具有收缩性,即很多的图片包括fake images都能用相同的特征向量来表示。总解决思想是加入额外的natural image prior和其他的loss(在半监督和生成图片的领域中很多的方法就是先提出一种很直观的现象和问题,然后给出自己的理解和分析,即使分析的本质上和其他的它所参考文章的原因一样,但是依然会给出作者自己不太一样或是换一种说法的解释,这样就能在分析上有所新,最后的解决方法还是在改动loss和添加loss上做文章)。

重要的句子:

1. Instead of computing distances in the image space, we compute distances between image features extracted by deep neural networks. This metric reflects perceptual similarity of images much better and, thus, leads to better results.

2.We demonstrate two examples of use cases of the proposed loss: (1) networks that invert the AlexNet convolutional network; (2) a modified version of a variat

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值