一、Mask R-CNN网络介绍
Mask R-CNN是何凯明2017年提出的一个实例分割(Instance segmentation)算法,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。,是ICCV2017的best paper。
Mask R-CNN网络的设计比较简单,①在Faster R-CNN的基础上,在原本的两个分支上(分类+坐标回归)增加一个简单的完全卷积网络(FCN)输出object mask 作为第三个分支,②同时用RoIAlign代替了Faster R-CNN的RoIPooling,如下图所示:
二、Mask R-CNN网络
1、为什么要用ROIAlign代替ROIPooling?它们有什么区别?
关于它们的区别及作用,我已经另外写了一篇文章。这里简单介绍下。
Faster R-CNN方法中,在进行Roi-Pooling之前需要进行两次量化操作(第一次是原图像中的目标到conv5之前的缩放,比如缩放32倍,目标大小是600,结果不是整数,需要进行量化舍弃,第二次量化是比如特征图目标是5*5,ROI-pooling后是2*2,这里由于5不是2的倍数,需要再一次进行量化,这样对于Roi Pooli