一、Mask R-CNN
用于实例分割的Mask R-CNN模型已经从之前的三种对象检测架构演变而来:
R-CNN:将输入图像呈现给网络,在图像上运行选择性搜索,然后使用预训练的 CNN 将选择性搜索的输出区域用于特征提取和分类。
Fast R-CNN:仍然使用Selective Search算法来获取region proposal,但是增加了Region of Interest (ROI) Pooling模块。从特征图中提取一个固定大小的窗口,并使用这些特征来获得最终的类标签和边界框。好处是网络现在是端到端可训练的。
Faster R-CNN:引入区域提议网络 (RPN),将区域提议直接烘焙到架构中,从而减轻对选择性搜索算法的需求。
