论文笔记:Mask R-CNN
1.简介
MASK RCNN是ICCV 2017 best paper。这篇文章提出了一个二阶段的实例分割网络,能以像素级精度分割出每一个不同的个体。
2.设计思路
这是一个两阶段的方法,第一阶段通过RPN网络提出一些可能的区域,第二阶段在每一个区域里面进行分类和回归,对于每一个区域都得到一个分类结果、一组边框offset和K个mask(K为总的类别数),第二阶段的三个任务同时进行,最后只取与类别对应的mask作为最终的mask。
3.具体实现方法
3.1网络结构
网络分为backbone和head两部分,分别完成region proposal和分类+边框预测+mask预测。backbone采用resnet-50-C4或者FPN,head使用全卷积神经网络。
3.2 RoIAlign
不同于faster rcnn使用的RoIPooling,RoIAlign通过双线性差值的方法找RoI对应的区域,避免了量化(使用取整函数)过程中造成的边界误差。
3.3 损失函数
L
=
L
c
l
s
+
L
b
o
x
+
L
m
a
s
k
L = L{cls} + L{box} + L{mask}
L=Lcls+Lbox+Lmask
其中
L
m
a
s
k
L{mask}
Lmask只计算对应类别的loss。