实例分割模型解析：solo模型

最新推荐文章于 2024-12-04 22:53:33 发布

原创

最新推荐文章于 2024-12-04 22:53:33 发布 · 2.4k 阅读

·

20

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #目标检测 #计算机视觉 #深度学习

论文链接：https://arxiv.org/abs/1912.04488
代码：https://github.com/WXinlong/SOLO

1.摘要

我们提出了一种新的、极其简单的实例分割方法。与许多其他密集预测任务（例如语义分割）相比，任意数量的实例使得实例分割更具挑战性。为了预测每个实例的掩码，主流方法要么遵循“检测然后分段”策略（例如，Mask R-CNN），要么首先预测嵌入向量，然后使用聚类技术将像素分组到各个实例中。我们认为通过引入“实例类别”的概念，从全新的角度来完成实例分割任务，该概念根据实例的位置和大小为实例中的每个像素分配类别，从而很好地将实例分割转换为单次分类可解决的问题问题。我们展示了一个更简单、更灵活的实例分割框架，具有强大的性能，达到了与 Mask R-CNN 相当的精度，并且在精度上优于最近的单次实例分割器。我们希望这个简单而强大的框架可以作为除实例分割之外的许多实例级识别任务的基线.

2.主要贡献

考虑图像中的对象实例之间的根本区别是什么？大多数情况是两个实例要么具有不同的中心位置，要不具有不同的对象大小。这一结果让人怀疑是否可以通过中心位置和对象大小直接区分实例？SOLO不是利用像素成对关系，而是在训练期间直接使用实例掩码注释进行学习，并且端到端的预测实例掩码，而无需进行分组后再处理。

3.方法

3.1 基本原理

如果对象的中心落入网格单元，则该网格负责
预测语义类别
分割该对象实例
SOLO连接到一个卷积主干，我们使用FPN，它生成不同大小的特征图金字塔，每个级别具有固定数量的通道，
有一张特征图，能够生成S的平方个mask，使用金字塔结构，金字塔中用了5个的话，就有5个S^2个mask出来
FPN的目

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。