MiVOS:用户交互型视频实例分割解耦框架(CVPR 2021)

本文介绍了CVPR 2021的MiVOS论文,这是一个由伊利诺伊大学和香港科技大学及快手联合提出的交互式视频对象分割算法,通过解耦交互到掩码和掩码传播,降低交互帧数,提高分割精度和效率。MiVOS包括S2M(交互到掩码)、传播和差异感知融合三个模块,实现了在用户交互下的高效视频物体分割。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关注公众号,发现CV技术之美

本文分享一篇 CVPR 2021 论文『Modular Interactive Video Object Segmentation: Interaction-to-Mask, Propagation and Difference-Aware Fusion』,由伊利诺伊大学厄巴纳-香槟分校、香港科技大学联合快手提出模块化交互式 VOS 算法, MiVOS,所需的交互帧数更低,分割精度与运行效率更高。

cae2f2fffeb00cb9f2a69c0215f96556.png

  • 论文链接:https://arxiv.org/abs/2103.07941

  • 项目链接:https://github.com/hkchengrex/MiVOS

      01      

前言

本文提出了模块化交互式VOS(MiVOS)框架,该框架将交互到掩码和掩码传播分离,从而实现更高的泛化性和更好的性能。单独训练的交互模块将用户交互转换为对象掩码,然后由传播模块使用一种新的top-k过滤策略在读取时空存储器时进行临时传播。为了有效地考虑用户的意图,提出了一种新颖的差异感知模块,以学习如何在每次交互之前和之后正确融合掩码,这些掩码通过利用时空存储器与目标帧对齐。

与当前现存的交互式VOS方法相比,作者提出的MiVOS所需的交互帧数更低,分割精度与运行效率更高。

与传统的转描方法相比,iVOS的进步显着减少了分割视频中物体标注所需的人力。(从标注100%的帧的Rotoscoping到现在只需标注3%的帧的Decoupled iVOS)。

23147916dbc0f6303aaecdec300ca27c.png

      02      <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值