Learning to Segment Instances in Videos with Spatial Propagation Network

最新推荐文章于 2024-02-15 21:01:13 发布

释然强

最新推荐文章于 2024-02-15 21:01:13 发布

阅读量766

点赞数

CC 4.0 BY-SA版权

分类专栏：视频分割文章标签：计算机视觉视频分割

本文链接：https://blog.youkuaiyun.com/weixin_42640840/article/details/84135269

本文提出一种基于深度学习的视频实例分割方法，包括前景分割、实例识别和空间传播网络（SPN）细化。SPN通过学习像素亲和力细化对象分割，而连通区域感知滤波器（CRFA）消除不一致区域，实现视频中实例分割的精确识别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Learning to Segment Instances in Videos with Spatial Propagation Network

Jingchun Cheng　　Sifei Liu　　 Yi-Hsuan Tsai　　 Wei-Chih Hung　　 Shalini De Mello
　　　　　　Jinwei Gu 　　Jan Kautz 　　　Shengjin Wang 　　　Ming-Hsuan Yang
　　Tsinghua University 　　　 University of California　　　 Merced 3NVIDIA Research

一、摘要

提出了一个基于深度学习的实例对象分割。

具体分为三步：

1、基于ResNet-101训练了一个通用模型用于前景背景传播；
2、通过在测试视频的第一帧使用增强对象注释微调模型以此训练实例模型和单个对象分割；
为了在视频中区分不同的实例，把实例中的每个对象都计算了像素级score map，每个score map 表明了对象的相似性并且仅在第一步中获得的前景掩模内计算。为精炼score map ，训练了空间传播网络。空间传播网络旨在训练如何基于每个帧中的成对相似性在空间传播粗分割掩码，以外还应用了滤波器，在视频中时间和空间的一致性下识别一个最好的连通区域。
3、通过比较不同实例的得分图确定每个视频中的实例对象分割。