实例分割论文精读：Mask R-CNN

最新推荐文章于 2024-03-05 22:09:22 发布

原创

最新推荐文章于 2024-03-05 22:09:22 发布 · 1.4k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#cnn #深度学习 #目标检测 #计算机视觉 #人工智能 #图像处理 #神经网络

1.摘要

本文提出了一种概念简单、灵活、通用的实例分割方法，该方法在有效地检测图像中的物体同时，为每个物体实例生成一个实例分割模板，添加了一个分支，用于预测一个对象遮罩，与现有的分支并行，用于边界框识别，Mask R-CNN易于训练，只给Faster R-CNN增加了很小的开销,运行速度为5fps,另外,Mask R-CNN很容易推广到其他任务，例如，允许我们在同一框架中估计人类姿势，我们展示了COCO系列挑战的所有三个方面的最佳结果，包括实例分割、边界框对象检测以及人类关键点检测，没有任何花里胡哨的东西，Mask R-CNN在每项任务上都优于所有现有的模型参赛作品，包括COCO 2016挑战赛的获胜者。我们希望我们简单而有效的方法将作为一个坚实的基线，并有助于简化实例级识别的未来研究。

2.模型结构图

在这里插入图片描述

3.算法步骤

1.首先，输入一幅你想处理的图片，然后进行对应的预处理操作，或者预处理后的图片；
2.然后，将其输入到一个预训练好的神经网络中（ResNet等）获得对应的feature map
3.接着，对这个feature map中的每一点设定预定个的ROI，从而获得多个候选ROI；
4.接着，将这些候选的ROI送入RPN网络进行二值分类（前景或背景）和BB回归，过滤掉一部分候选的ROI；
5.接着，对这些剩下的ROI进行ROIAlign操作（即先将原图和feature map的pixel对应起来，然后将feature map和固定的feature对应起来）；
6.最后，对这些ROI进行分类（N类别分类）、BB回归和Mask生成（在每一个ROI里面进行FCN操作）。