优酷视频增强和超分表率挑战赛总结

Team 1st
研究现状:
1 残差结构:EDSR
2 多分支结构:REDNet
3循环结构:DRCN
4 渐进式结构:SCN
5 注意力机制:RCAN,DRLN
6 对抗模型:ESRGAN
视频帧对齐
视频帧融合
方法:三维卷积,循环结构,滤波器预测
EDVR:对齐——融合——重建
EDVR问题:
感知能力不够强
对齐模块:
3D Non Local (何凯明)
作者的模型:separate Non local
时序信息不充分
融合模块:temporal and Spatial attention + 3D Conv
特征表达 不高效:resNet Block +channel attention
评委问到了速度问题。
作者:Non local ——
Team 2st
视频特点:场景转换频繁
噪声模型未知
方法:CNN based,resnet based densenet based resnet-densenet based,gan based
作者自己将yuv420转成yuv444来训练网络。
初赛:rcan
融合多帧信息:
作者最后用的RCAN结构:
L1+L2 + gradient 损失函数

比较关注场景切换问题,梯度让边缘更加清晰,适合卡通数据
亮点:实现yuv420转换成yuv444.,self-semble,loss改进,基础网络RCAN;

Team 3st

rgb训练会带来精度损失,作者用y训练的。y比rgb性能高很多;结合edvr的PCD
网络,加入两个参数,自适应加权;
加入多帧对齐,多帧融合模块;
作者使用3d卷积进行特征融合,
作者对yuv三个通道分别训练;

Team 4st
数据格式如何转换,下采样方式是怎样的,
格式转换转成:yuv420 转成yuv444
还是场景切换问题
镜头切换问题:
每个队伍都问了泛化能力

Team 5st
训练数据是yuv格式

Team 6st
yuv转换问题,yuv损失函数。

总结:打比赛,数据处理很重要

### 修改Mask R-CNN中的图像输入辨率 在计算机视觉任务中,尤其是涉及卷积神经网络的任务,输入图像的尺寸是一个重要的参数。对于Mask R-CNN而言,默认情况下该框架会接受特定大小的图片作为输入。如果希望改变这一默认行为来适应不同尺度的数据集,则需对配置文件做出相应调整[^1]。 具体来说,在Matterport版本的Mask R-CNN实现里,可以通过编辑`mrcnn/config.py`内的类属性完成这项工作: ```python class Config(object): """Base configuration class. For custom configurations, create a sub-class that inherits from this one and override properties that need to be changed. """ IMAGE_MAX_DIM = 1024 # 图像最大边长 IMAGE_MIN_DIM = 800 # 图像最小边长 ... ``` 上述代码片段展示了如何通过设定`IMAGE_MAX_DIM``IMAGE_MIN_DIM`两个变量控制输入至模型的最大与最小维度。当一幅原始图被送入网络前,它会被缩放使得较短的一侧等于`IMAGE_MIN_DIM`而较长一侧不过`IMAGE_MAX_DIM`;同时保持原有的宽高比例不变[^2]。 另外值得注意的是,除了直接修改源码外,许多预训练好的Mask R-CNN库也允许使用者通过命令行选项或是API接口指定这些参。例如使用Detectron2时可以如下操作: ```bash python train_net.py --config-file "configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml" \ MODEL.ROI_HEADS.SCORE_THRESH_TEST=0.5 \ INPUT.MIN_SIZE_TRAIN=600 \ INPUT.MAX_SIZE_TRAIN=1000 \ INPUT.MIN_SIZE_TEST=600 \ INPUT.MAX_SIZE_TEST=1000 \ ...other parameters... ``` 这里设置了测试阶段(`INPUT.MIN_SIZE_TEST`, `INPUT.MAX_SIZE_TEST`)以及训练期间(`INPUT.MIN_SIZE_TRAIN`, `INPUT.MAX_SIZE_TRAIN`)所使用的最小/最大尺寸[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值