论文基本信息
- 标题:Mask R-CNN
- 作者:Kaiming He Georgia Gkioxari Piotr Dollár Ross Girshick
- 机构:Facebook AI Research (FAIR)
- 来源:ICCV
- 时间:2017
- 论文地址:https://arxiv.org/abs/1703.06870
- 代码地址:https://github.com/facebookresearch/Detectron
论文概要
解决问题
本文在Faster RCNN上进行了改进,提出了Mask RCNN用来解决分割的问题。同时该模型也可以用于目标检测、关键点检测等其他的计算机视觉任务,并且实验证明,该模型具有较好的效果。
Introduction
- 分割任务分为实例分割和语义分割。语义分割是将不同种类的物体按像素级别分类,实例分割是不同种类的不同个体也要进行分别。
- 本文提出了一种非常简洁、灵活并且快速的方法来实现分割任务——Mask R-CNN。在Faster RCNN的基础上增加了一个预测掩码图的分支。这个掩码的分支是一个FCN(全卷积)在每一个RoI后。
- 在Faster RCNN中采用RoIPool 将特征图映射成固定大小的特征向量,在Mask R-CNN中提出了 RoIAlign
- 对每一个类进行一个独立预