BasicVSR: The Search for Essential Components in Video Super-Resolution and Beyond
BasicVSR:寻找视频超分辨率及更高分辨率的关键组件
论文:https://arxiv.org/abs/2012.02181
代码:GitHub - sunny2109/BasicVSR_IconVSR_PyTorch: Unofficial PyTorch code for BasicVSR(个人还未复现,这是大佬复现的,可以参考)
本篇笔记主要对整篇论文从头到尾进行阅读分析,本文内容有点多,主要是对不同部分的总结以及图例解释,如果只对模型原理部分有兴趣,可直接观看第四部分。
本文为了详细说明各图、公式在各组件中的情况,所以对原文图片、公式做了切割和拼接,保证该内容是在该组件中生效的。
目录
(1)摘要
提出本方案设计的目的:VSR需要考虑时间维度,所以很多模型增加了复杂组件用于这个方面。而强化基础组件(传播、对齐、聚合、上采样),通过重用和重新设计基础组件,减少复杂组件的加入,提出了BasicVSR,在BasicVSR基础上又提出IconVSR,它提出一种信息填充机制和耦合传播方案,获得比BasicVSR更好的效果。
(2)引言
without bells and whistles. 没有花里胡哨的,就是不通过精调参数,增加数据集等方式,就让模型获得很好的效果。
视频超分(VSR)和图片超分(SISR)不同,视频超分中存在多个高度相关且没有对齐的帧,所以很多模型为了解决时间序列中存在的隐含关系而增加了模型的复杂度,从而导致运行时间复杂,如下图所示:可以看出本次设计的模型在PNSR标准和运行时间上相较其他模型都有良好的优势。

作者将VSR模型中的基础组件进行划分,从两类模型实现方式(滑动窗口(Sliding-Window)以及循环神经网络(Recurrent))进行对比,标注出不同模型在不同组件中的使用情况。如下表

通过对比表格和上述的图1中的数据,发现传播和对齐的组件选择会很大程度上影响模型的性能和效率,所以对于BasicVSR模型和IconVSR在各个组件上的选择如下:
| BasicVSR | IconVSR | |
| 传播 | Bidirectional(双向传播) | Bidirectional(coupled)(耦合的双向传播) |
| 对齐 | 基于光流方案( optical flow-based method) |
基于光流方案( optical flow-based method) |
| 聚合 | Concatenate(特征串联聚合方式) | Concatenate+Refill(信息填充的特征串联聚合方式) |
| 上采样 | Pixel-Shuffle | Pixel-Shuffle |
耦合传播:前向传播和后向传播之间进行了信息交换,减少由于遮挡或者图像边界造成的误差累积,允许传播以完整的形式访问整个帧序列。
信息填充机制:利用附加模块从稀疏选择的关键帧中提取特征,将特征补充道主网络中进行特征聚合。
(3)相关工作
本章节主要对VSR的相关工作做介绍,现有的VSR方法可分为两个框架:滑动窗口和循环神经网络,但是现有方法为了解决传播和对齐方面的问题产生了许多的复杂组件。本篇论文使用基础组件,双向传播加基于光流的对齐方法就超越了很多方法。然后介绍了IconVSR的信息填充机制,讲述了以往算法对于关键帧和非关键帧的处理,IconVSR通过连接传播分支,使长期信息可以在相互关联的时间间隔内传播。
(4)本文方法介绍
首先BasicVSR采用基础组件训练的baseline具有通用性,而BasicVSR的结构如下图所示:

S、W、R分别代表光流评估模块、空间扭曲模块以及残差模块
左图为BasicVSR的结构,LR超分为SR图片,其中采用双向传播也就是
和

最低0.47元/天 解锁文章
278





