DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation
DUF:无需显式运动补偿的动态上采样滤波器的深视频超分辨率网络
代码:https://github.com/yhjo09/VSR-DUF
本篇笔记主要对整篇论文从头到尾进行阅读分析,本文内容有点多,主要是对不同部分的总结以及图例解释,如果只对模型原理部分有兴趣,可直接观看第四部分。
本文为了详细说明各图、公式在各组件中的情况,所以对原文图片、公式做了切割和拼接,保证该内容是在该组件中生效的。
目录
(1)摘要
目前基于深度学习的VSR方法大多依赖显示运动补偿的精度,也就是运动估计和运动补偿的精度。而本文提出的一种端到端的网络,网络中包含动态上采样filter和残差图像处理,利用隐式信息进行动态上采样filter的生成(隐式运动补偿不需要进行复杂的运动估计,利用帧之间的互补信息进行帧补偿),通过残差网络进行时空领域的细节补充,再通过上采样filter重建HR图像,辅助一种数据增强的技术生成HR视频。
(我用一下我的BasicVSR中的比较图进行对比,可以从DUF的参数,运动时间以及PSNR看出这个算法的基本效果,让大家对这个算法有个大致感官)

(2)引言
现有的硬件设备4K和8K的屏幕往往没有合适该分辨率的内容,进行图片超分就是对视频的每一帧进行不关联的超分,但是这种超分会导致各个图像之间没有考虑时空关系出现伪影和闪烁的问题。传统的VSR算法是通过计算亚像素运动,计算两个LR图像之间的亚像素之间的位移(如下图),后续的基于深度学习的方法基于上述思想,进行显示运动补偿,通过进行运动估计和运动补偿进行帧之间的细节对齐和补充,然后通过上采样获得HR视频,但是这种方式存在两个问题:1,严重依赖运动估计和补偿的精度。2,混合来自多个LR帧的目标帧恢复的图像会模糊。

(LR图之间亚像素之间的关系,进行亚像素位移实际上就是通过计算两个LR图像之间亚像素之间的位置关系进行位移对齐,然后补充目标帧没有的细节信息)
本文设计的方法中,如下图所示,通过对输入的多个视频帧进行隐式的运动补偿计算,生成相应的动态上采样filter,然后直接对输入的

本文详细分析了DUF(Deep Video Super-Resolution Network Using Dynamic Upsampling Filters)论文,这是一种无需显式运动补偿的视频超分辨率方法。DUF利用动态上采样滤波器和残差学习,通过隐式运动补偿和时间增强技术,实现了视频帧间的细节补充和重建。实验表明,尽管参数较少,但DUF在保持高PSNR和SSIM值的同时,能够生成精细的细节,适用于预处理视频,但速度较慢,不适合实时应用。
最低0.47元/天 解锁文章
1272

被折叠的 条评论
为什么被折叠?



