Mask R-CNN个人理解

本文介绍了Mask R-CNN在Faster R-CNN基础上的改进,包括采用ResNet-FPN进行特征提取,用RoI Align替代RoI Pooling以提高定位精度,以及新增加的mask分支用于生成像素级分割。通过这些改进,Mask R-CNN在实例分割任务上表现出色。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Mask R-CNN

Mask R-CNN算法是在Faster R-CNN架构的基础之上的,它主要有两个贡献:
1、用更精确RoI Align模块来替换RoI Pooling模块
2、从RoI Align模块中插入一个额外的分支----mask 分支
这个mask分支的输入为RoI Align 的输出,然后将其输入到两个conv层,conv层的输出就是mask本身。
Mask R-CNN的架构如下图所示:

在这里插入图片描述

图1 Mask R-CNN的架构

在我看来相较于Faster R-CNN,Mask R-CNN的改进在于三个地方:
(1)、使用ResNet-FPN进行特征的提取;
(2)、将Rol Pooling 创造性的修改为Rol Align ;
(3)、头部网络的修改,即增加了一个mask的分支;

1、ResNet-FPN 进行特征提取

FPN结构中包括自下而上,自上而下和横向连接三个部分,如下图所示。这种结构可以将各个层级的特征进行融合,使其同时具有强语义信息和强空间信息。
preview

图2 FPN
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值