BasicVSR: The Search for Essential Components in Video Super-Resolution and Beyond阅读笔记

BasicVSR: The Search for Essential Components in Video Super-Resolution and Beyond

BasicVSR:寻找视频超分辨率及更高分辨率的关键组件


论文:https://arxiv.org/abs/2012.02181

代码:GitHub - sunny2109/BasicVSR_IconVSR_PyTorch: Unofficial PyTorch code for BasicVSR(个人还未复现,这是大佬复现的,可以参考)

本篇笔记主要对整篇论文从头到尾进行阅读分析,本文内容有点多,主要是对不同部分的总结以及图例解释,如果只对模型原理部分有兴趣,可直接观看第四部分。

本文为了详细说明各图、公式在各组件中的情况,所以对原文图片、公式做了切割和拼接,保证该内容是在该组件中生效的。

​​​​​​​

目录

(1)摘要

(2)引言

(3)相关工作

(4)本文方法介绍

(4.1)BasicVSR

(4.1.1)传播

 (4.1.2)对齐

 (4.1.3)聚合与上采样

 (4.2)IconVSR

(4.2.1)信息填充机制

(4.2.2)耦合传播机制

 (5)实验

(5.1)Basic和Icon的相比较其他模型的实验结果:

 (5.2)Basic和Icon的消融实验实验结果:

 (5.2.1)信息填充机制:

(5.2.2)耦合传播机制: 

 (5.3)对IconVSR的分析总结


(1)摘要

提出本方案设计的目的:VSR需要考虑时间维度,所以很多模型增加了复杂组件用于这个方面。而强化基础组件(传播、对齐、聚合、上采样),通过重用和重新设计基础组件,减少复杂组件的加入,提出了BasicVSR,在BasicVSR基础上又提出IconVSR,它提出一种信息填充机制耦合传播方案,获得比BasicVSR更好的效果。

(2)引言

without bells and whistles. 没有花里胡哨的,就是不通过精调参数,增加数据集等方式,就让模型获得很好的效果。

 视频超分(VSR)和图片超分(SISR)不同,视频超分中存在多个高度相关且没有对齐的帧,所以很多模型为了解决时间序列中存在的隐含关系而增加了模型的复杂度,从而导致运行时间复杂,如下图所示:可以看出本次设计的模型在PNSR标准和运行时间上相较其他模型都有良好的优势。

 作者将VSR模型中的基础组件进行划分,从两类模型实现方式(滑动窗口(Sliding-Window)以及循环神经网络(Recurrent))进行对比,标注出不同模型在不同组件中的使用情况。如下表

 通过对比表格和上述的图1中的数据,发现传播和对齐的组件选择会很大程度上影响模型的性能和效率,所以对于BasicVSR模型和IconVSR在各个组件上的选择如下:

BasicVSR IconVSR
传播 Bidirectional(双向传播) Bidirectional(coupled)(耦合的双向传播)
对齐

基于光流方案(

optical flow-based method)

基于光流方案(

optical flow-based method)

聚合 Concatenate(特征串联聚合方式) Concatenate+Refill(信息填充的特征串联聚合方式)
上采样 Pixel-Shuffle Pixel-Shuffle

耦合传播:前向传播和后向传播之间进行了信息交换,减少由于遮挡或者图像边界造成的误差累积,允许传播以完整的形式访问整个帧序列。

信息填充机制:利用附加模块从稀疏选择的关键帧中提取特征,将特征补充道主网络中进行特征聚合。

(3)相关工作

本章节主要对VSR的相关工作做介绍,现有的VSR方法可分为两个框架:滑动窗口和循环神经网络,但是现有方法为了解决传播和对齐方面的问题产生了许多的复杂组件。本篇论文使用基础组件,双向传播加基于光流的对齐方法就超越了很多方法。然后介绍了IconVSR的信息填充机制,讲述了以往算法对于关键帧和非关键帧的处理,IconVSR通过连接传播分支,使长期信息可以在相互关联的时间间隔内传播。

(4)本文方法介绍

首先BasicVSR采用基础组件训练的baseline具有通用性,而BasicVSR的结构如下图所示:

 S、W、R分别代表光流评估模块、空间扭曲模块以及残差模块

左图为BasicVSR的结构,LR超分为SR图片,其中采用双向传播也就是

评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值