论文笔记:Learning Video Object Segmentation from Unlabeled Videos

这篇CVPR2020的论文,和MAST的任务相仿,都是从training阶段就放弃annotation的使用,变成了彻头彻尾的无监督学习,为VOS任务提供了一个新的高效学习范式。不同的是这篇文章不仅可以用来做O-VOS(one shot半监督给定第一帧mask),还可以用来做Z-VOS(zero shot无监督无第一帧mask)。

在这里插入图片描述
文章采用multiple granularities的方式,来学习到多粒度的视频帧的特征表示,四种granularity如下:

(1)frame granularity:通过显著性检测或者CAM maps来挖掘帧内的信息,鉴别前景部分和背景部分;

(2)short-term granularity:通过施加局部表示的consistency约束,用来比较连续几帧间的视觉pattern;

(3)long-range granularity:施加远距离frame之间的语义联系,使得帧之间的特征表示对occlusion,外观的变化以及deformation;

(4)whole-video granularity:通过融合多帧的信息,让视频表示去学习到global和conpact的内容,并且和其他视频序列的representation加以区别。

感觉(2)和(3)

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值