MASK_RCNN = FAST_RCNN + FCN
MASK_RCNN算法是由FAST_RCNN和语义分割算法FCN组成。FAST_RCNN负责完成目标检测任务,FCN负责完成语义分割的任务。在原始的FAST_RCNN的层面上面增加了FCN模块来产生对应的MASK分支,负责在像素层面进行分类。
FAST_RCNN:Backbone+FPN(可选)+RPN+ROI Pooling + 检测头
MASK_RCNN:Backbone+FPN(可选)+RPN+ROI Align + 检测头
两者在经过RPN模块后的处理办法不一样
其实RoIAlign就是在RoI pooling上稍微改动过来的,可以说ROI Align是为了更好的在像素层面上进行分类。
从图书可以看出来

左图ROI Pooling

本文详细介绍了Mask R-CNN算法的组成及工作原理。该算法结合了Fast R-CNN的目标检测能力和全卷积网络(FCN)的语义分割能力,通过引入RoIAlign解决了像素对齐问题,实现了精准的实例分割。

最低0.47元/天 解锁文章
1924

被折叠的 条评论
为什么被折叠?



