目录
一、超分辨重建是什么
你是否有过这样的经历:满心欢喜地用手机记录下一场绝美的落日,回家查看时却发现照片中的晚霞和落日都有些模糊,原本震撼的美景变得平淡无奇;又或者在观看一场精彩的体育赛事转播时,运动员们的精彩瞬间在低分辨率的屏幕上显得不够清晰,无法让人尽情享受那热血沸腾的时刻。这些因图像分辨率不足而带来的遗憾,在我们的生活中屡见不鲜。
而超分辨重建,就是解决这类问题的神奇 “魔法”。简单来说,超分辨重建是一种将低分辨率图像转换为高分辨率图像的技术 。它就像是一位技艺高超的图像 “修复师”,能够从低分辨率图像中挖掘出更多的细节和信息,然后巧妙地填补缺失的像素,让模糊的图像变得清晰锐利,使我们能够看清那些原本隐藏在模糊背后的精彩细节。
二、超分辨重建的发展历程
超分辨重建技术的发展历程犹如一部精彩纷呈的科技进化史,众多科研人员在这个领域不断探索创新,推动着技术的持续进步。
超分辨重建技术最早可追溯到 20 世纪 60 年代 ,Harris 提出了单幅图像复原的超分辨率方法,并采用 PSF(点 Spread Function)的解析模型对大气扰动的模糊进行了去(反)卷积运算。此后,研究人员围绕超分辨重建技术展开了深入研究,传统的超分辨率重建算法主要依靠基本的数字图像处理技术进行重建,常见的方法包括基于插值、退化模型和学习的算法。
基于插值的超分辨率重建方法是较为基础的一类算法,它将图像上每个像素都看做是图像平面上的一个点,对超分辨率图像的估计可以看做是利用已知的像素信息为平面上未知的像素信息进行拟合的过程,这通常由一个预定义的变换函数或者插值核来完成。常见的基于插值的方法包括最近邻插值法、双线性插值法和双立方插值法等。这些方法计算简单、易于理解,但复原出的图像常常出现模糊、锯齿等现象 ,就像是用简单的拼图方式去还原一幅复杂的画作,虽然能大致呈现图像的轮廓,但细节之处却差强人意。
基于退化模型的超分辨率重建方法,则从图像的降质退化模型出发,假定高分辨率图像是经过了适当的运动变换、模糊及噪声才得到低分辨率图像。这种方法通过提取低分辨率图像中的关键信息,并结合对未知的超分辨率图像的先验知识来约束超分辨率图像的生成。常见的方法包括迭代反投影法、凸集投影法和最大后验概率法等。这类算法试图通过对图像退化过程的逆向推导来恢复高分辨率图像,就如同根据破损物品的碎片和对其原貌的了解来尝试修复它,但在实际应用中,由于图像退化过程的复杂性,往往难以准确恢复出高质量的高分辨率图像。
随着机器学习技术的兴起,基于学习的超分辨率重建方法应运而生。这类方法利用大量的训练数据,从中学习低分辨率图像和高分辨率图像之间某种对应关系,然后根据学习到的映射关系来预测低分辨率图像所对应的高分辨率图像,从而实现图像的超分辨率重建过程。常见的基于学习的方法包括流形学习、稀疏编码方法等。与前两类方法相比,基于学习的方法能够利用数据中的统计信息,在一定程度上提升了超分辨重建的效果,但由于其对特征的表达能力有限,很大程度上限制了重建效果的进一步提升。
直到 2014 年,Dong 等人提出的 SRCNN(Super-Resolution Convolutional Neural Network)算法,为超分辨重建领域带来了革命性的变化 。SRCNN 是深度学习方法在超分辨问题的首次尝试,它是一个比较简单的卷积网络,由 3 个卷积层构成,每个卷积层负责不同的职能。第一个卷积层的作用主要是负责提取高频特征,第二个卷积层则负责完成从低清特征到高清特征的非线性映射,最后一个卷积层的作用是重建出高分辨率的图像。SRCNN 的确立了深度学习方法在处理超分辨这类问题时的基本思想,开启了深度学习在超分辨重建领域应用的新时代,就像为超分辨重建技术注入了一股强大的新动力,让人们看到了提升图像分辨率的新希望 。
自 SRCNN 之后,基于深度学习的超分辨重建算法如雨后春笋般不断涌现。研究人员们针对 SRCNN 存在的问题,如计算量大、网络结构简单导致超分辨效果有待提高等,进行了一系列的改进和创新。ESPCN(Efficient Sub-Pixel Convolutional Neural Network)基于 SRCNN 进行了一些改进,首次提出了亚像素卷积层,去除了低分辨率图像送入神经网络前的预上采操作,极大降低了 SRCNN 的计算量,提高了重建效率 。然而,由于当时深度卷积网络训练中存在梯度消失的问题,导致网络收敛性变差,模型性能降低,ESPCN 的超分辨效果也受到了一定的限制。
直到 ResNet 提出残差网络结构之后,梯度消失的问题才得到比较好的解决,这也为超分辨重建网络的进一步发展提供了有力的支持。VDSR(Very Deep Super-Resolution Network)是残差网络以及残
三、超分辨重建的原理大揭秘
超分辨重建技术能够将低分辨率图像转化为高分