【文章阅读】【超解像】--Enhanced Deep Residual Networks for Single Image Super-Resolution

韩国首尔大学研究团队提出的EDSR和MDSR,通过改进残差网络结构和引入多尺度模型,在减小模型体积的同时提升了图像超分辨率性能。EDSR在SRResNet基础上去除BN层,采用残差缩放稳定训练,而MDSR实现了不同放大倍数的参数共享。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【文章阅读】【超解像】–Enhanced Deep Residual Networks for Single Image Super-Resolution

论文链接:https://arxiv.org/abs/1707.02921

code:https://github.com/thstkdgus35/EDSR-PyTorch

​ 本文是韩国首尔大学的研究团队出的用于SR任务的新方法(之前方法的修正),分别为增强深度超分辨网络EDSR和一种多尺度深度超分辨率MDSR,在减少模型大小的同时也提高了图像性能,并赢得到了NTIRE2017超分辨挑战赛的第一名和第二名。

1.主要贡献

​ 1). 在残差网络结构的基础上做了修改,残差网络结构适用于图像分类等任务上,不适合直接套用在SR应用任务上。

​ 2). 作者提出了一种多尺度模型,进行了不同放大倍数模型参数共享,并在处理每一个模型时都能取得较好的结果。

2.论文分析

1). 模型基本结构

​ 在SRResNet结构基础上将BN成去掉,主要是由于BN层对特征进行了批量归一化,使网络结构的灵活性降低(使网络能表现的特征减少)。训练过程中,BN层占用了大量的GPU存储资源,去掉BN层后能降低40%的GPU存储资源,可用于训练更深的网络结构。
在这里插入图片描述

2). Single-scale model
在这里插入图片描述

​ 单模型网络结构如上图所示,文中提出太多的残差块导致训练不稳定,文中提出了residual scaling 方法,即残差块在相加前,经过卷积处理的数据乘以一个小数(0.1),这样可以保证训练更加稳定。最终模型使用B=32,F=256,B表示残差块,F表示feature channels.

​ 利用训练过的放大2倍的模型作为初始模型训练放大4倍的模型,可以加速模型的训练速度,如下:
在这里插入图片描述

​ 3). Multi-scale model
在这里插入图片描述

​ 多尺度模型开始每个放大倍数都有两个独立的残差块,后面经过相同的残差块,最后再使用独自的升采样模块来提高分辨率。模型的B=80 F=64。

​ 4)训练细节

​ 数据:用的是DIV2K数据集,800张训练图片,100张验证图像,100张测试图像,每张图像的分辨率为2K;

​ MDSR训练过程中,将放大2倍,3倍,4倍三种尺度随机混合作为训练集,在梯度更新的时候,只对相应的尺寸的那部分参数进行更新。

​ 几何自融合:测试时将图像90度旋转以及翻转,共形成8种不同的图像,分别送入网络进行处理,处理后变换到原来的位置,然后8张图像取平均,该方法可以使测试结果又稍微的提升。

​ 训练优化:利用ADAM优化器,minibatch size为16,初始学习率为0.0001,训练输入图像为48x48的RGB图像。

​ 模型结构参数如下:
在这里插入图片描述

3.结果分析

在这里插入图片描述
在这里插入图片描述

4.参考

  1. https://blog.youkuaiyun.com/Gavinmiaoc/article/details/80452229

感谢网上的各种资源,在阅读原文和相关参考资源的基础上进行了总结,如有问题,烦请指正,谢谢!

### 单图像分辨率技术概述 单图像分辨率(Single Image Super-Resolution, SISR)是一种旨在从低分辨率图像重建高分辨率图像的技术。近年来,基于深度学习的方法显著提升了SISR的效果。其中,“Transformed Self-Exemplars”方法通过利用图像内部的自相似性来增强细节恢复能力[^1]。 #### Transformed Self-Exemplars 技术的核心概念 Transformed Self-Exemplars 方法的主要思想是从输入图像本身提取特征作为参考样本,并通过对这些样本进行变换以适应不同的局部结构。这种方法避免了对外部训练数据集的高度依赖,从而减少了过拟合的风险并提高了泛化性能[^2]。 具体而言,该算法设计了一个端到端可训练框架,其中包括以下几个关键组件: 1. **Self-Similarity Mining**: 自动检测图像中的重复模式或纹理区域。 2. **Transformation Module**: 对挖掘出的自相似块应用几何和光度变换,使其能够匹配目标位置的需求。 3. **Fusion Mechanism**: 将多个转换后的样例融合在一起,形成最终的高分辨率预测结果。 此过程不仅保留了原始信号的重要特性,还有效增强了边缘锐利度以及颜色一致性[^3]。 #### 相关研究进展 除了上述提到的技术外,还有其他一些重要的工作也值得关注。例如,Dong等人提出的 SRCNN (Super Resolution Convolutional Neural Network),首次将卷积神经网络引入到了级解析领域;Kim等人开发的 EDSR (Enhanced Deep Residual Networks for Single Image Super-Resolution) 则进一步优化了模型架构,在速度与质量之间取得了更好的平衡[^4]。 值得注意的是,尽管当前许多先进方案都采用了复杂的多尺度特征表示或者注意力机制,但 Transforming Self-examples 的独特之处在于它强调充分利用单一输入源内的信息资源,这使得其特别适合处理那些难以获取充足外部标注资料的应用场景[^5]。 ```python import torch.nn as nn class SimpleSRModel(nn.Module): def __init__(self): super(SimpleSRModel, self).__init__() self.conv1 = nn.Conv2d(3, 64, kernel_size=9, padding=4) self.relu = nn.ReLU() self.conv2 = nn.Conv2d(64, 32, kernel_size=1, padding=0) self.conv3 = nn.Conv2d(32, 3, kernel_size=5, padding=2) def forward(self, x): out = self.relu(self.conv1(x)) out = self.relu(self.conv2(out)) out = self.conv3(out) return out ``` 上面展示了一种简单的 SR 模型定义方式,实际项目中可能需要更复杂的设计才能达到理想效果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值