Mask rcnn背景
原文献:mask rcnn
基于Mask R-CNN分割是目前主流的分割方式之一,它在多个领域都可适用,其发展速度也给实例分割提供良好的技术支持和平台供应。
Mask R-CNN是Faster R-CNN的延伸,是在后者原有的bounding box recognition分支上分出一条与之并行的预测object mask的分支。该方法结合了R-CNN、Fast R-CNN、Faster R-CNN的优点,并且改良了ROI Pooling,提出了ROI Align。
Mask rcnn 框架图概况

在Faster rcnn上强化网络图
1、Resnet + FPN强化特征提取,特征金字塔(FPN)

首先,选择一张需要处理的图片,然后对该图片进行预处理操作;
然后,将处理过的图片送入预训练的特征网络中如深度残差网络等,即构建所谓的bottom-up网络;
接着,构建对应的top-down网络,对层4进行上采样操作,先用1x1的卷积对层2进行降维处理,然后将两者相加
(对应元相加),最后进行3x3的卷积操作;
接下来在4到6这三层分别进行区域候选操作,在3x3的卷积层后增加两个分支操作,分别用1x

Mask R-CNN是Faster R-CNN的拓展,它通过额外的分支预测目标掩模,适用于多领域的实例分割。该模型利用Resnet + FPN增强特征提取,改进ROI Pooling为ROI Align,提升准确性。文章详细介绍了Resnet的残差学习解决深度网络训练问题,并探讨了反向传播、区域候选网络(RPN)、全卷积网络(FCN)等关键概念。
最低0.47元/天 解锁文章
768

被折叠的 条评论
为什么被折叠?



