实例分割模型解析:solo模型

论文链接:https://arxiv.org/abs/1912.04488
代码:https://github.com/WXinlong/SOLO

1.摘要

我们提出了一种新的、极其简单的实例分割方法。与许多其他密集预测任务(例如语义分割)相比,任意数量的实例使得实例分割更具挑战性。为了预测每个实例的掩码,主流方法要么遵循“检测然后分段”策略(例如,Mask R-CNN),要么首先预测嵌入向量,然后使用聚类技术将像素分组到各个实例中。我们认为通过引入“实例类别”的概念,从全新的角度来完成实例分割任务,该概念根据实例的位置和大小为实例中的每个像素分配类别,从而很好地将实例分割转换为单次分类可解决的问题问题。我们展示了一个更简单、更灵活的实例分割框架,具有强大的性能,达到了与 Mask R-CNN 相当的精度,并且在精度上优于最近的单次实例分割器。我们希望这个简单而强大的框架可以作为除实例分割之外的许多实例级识别任务的基线.

2.主要贡献

考虑图像中的对象实例之间的根本区别是什么?大多数情况是两个实例要么具有不同的中心位置,要不具有不同的对象大小。这一结果让人怀疑是否可以通过中心位置和对象大小直接区分实例?SOLO不是利用像素成对关系,而是在训练期间直接使用实例掩码注释进行学习,并且端到端的预测实例掩码,而无需进行分组后再处理。

3.方法

3.1 基本原理

如果对象的中心落入网格单元,则该网格负责
预测语义类别
分割该对象实例
SOLO连接到一个卷积主干,我们使用FPN,它生成不同大小的特征图金字塔,每个级别具有固定数量的通道,
有一张特征图,能够生成S的平方个mask,使用金字塔结构,金字塔中用了5个的话,就有5个S^2个mask出来
FPN的目

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值