论文笔记：Learning Video Object Segmentation from Unlabeled Videos

最新推荐文章于 2023-07-05 21:25:43 发布

原创

最新推荐文章于 2023-07-05 21:25:43 发布 · 1.9k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

这篇CVPR2020的论文，和MAST的任务相仿，都是从training阶段就放弃annotation的使用，变成了彻头彻尾的无监督学习，为VOS任务提供了一个新的高效学习范式。不同的是这篇文章不仅可以用来做O-VOS(one shot半监督给定第一帧mask)，还可以用来做Z-VOS(zero shot无监督无第一帧mask)。

在这里插入图片描述
文章采用multiple granularities的方式，来学习到多粒度的视频帧的特征表示，四种granularity如下：

（1）frame granularity：通过显著性检测或者CAM maps来挖掘帧内的信息，鉴别前景部分和背景部分；

（2）short-term granularity：通过施加局部表示的consistency约束，用来比较连续几帧间的视觉pattern；

（3）long-range granularity：施加远距离frame之间的语义联系，使得帧之间的特征表示对occlusion，外观的变化以及deformation；

（4）whole-video granularity：通过融合多帧的信息，让视频表示去学习到global和conpact的内容，并且和其他视频序列的representation加以区别。

感觉(2)和(3)两点与MAST的memory的目的有相似之处，但处理的方法完全不同；而(1)的存在使得本篇文章可以处理Z-VOS的任务。整个流程图如下图所示：

在这里插入图片描述
本篇文章的思路感

最低0.47元/天解锁文章

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。