基于水平集演化的边界框监督实例分割方法
1. 引言
实例分割旨在获取感兴趣对象的像素级标签,在自动驾驶和机器人操作等众多应用中发挥着重要作用。然而,现有的大多数实例分割方法采用全监督方式进行训练,严重依赖像素级掩码注释,这导致了高昂的标注成本。
为解决这一问题,边界框监督实例分割利用简单的边界框注释而非像素级掩码标签,近年来受到了广泛关注。但现有的边界框监督方法存在一些局限性,例如部分方法通过独立网络生成伪掩码标签,训练流程复杂且需要多个超参数;还有一些方法使用成对亲和性建模,过于简化了像素或颜色对共享相同标签的假设,导致实例分割性能不佳。
本文提出了一种新颖的单阶段边界框监督实例分割方法,将经典的水平集模型与深度神经网络巧妙结合。该方法通过连续的基于Chan - Vese能量的函数以端到端的方式迭代学习一系列水平集,使用简单的掩码监督SOLOv2模型预测每个实例的实例感知掩码图作为水平集。同时,利用输入图像及其深度特征来演化水平集曲线,并通过边界框投影函数获取初始边界。通过最小化完全可微的能量函数,在相应的边界框注释内迭代优化每个实例的水平集。
2. 相关工作
2.1 边界框监督实例分割
现有的实例分割方法大致可分为两类:一类是对从检测结果中提取的区域进行分割;另一类是直接以全卷积方式分割每个实例。但这些方法都依赖昂贵的像素级掩码注释。
边界框监督实例分割近年来越来越受关注。Khoreva等人提出在深度学习框架下使用边界框注释预测掩码,但严重依赖无监督分割方法生成的区域提议。Hsu等人将边界框监督实例分割表述为多实例学习问题,使用相邻像素对的亲和性正则化。BoxInst在高效的无RoI Co
超级会员免费看
订阅专栏 解锁全文
883

被折叠的 条评论
为什么被折叠?



