Mask R-CNN论文总结

Mask R-CNN在Faster R-CNN基础上加入分割分支,实现实例分割。通过RoIAlign解决特征对齐问题,采用解耦方式提高分割准确性。网络结构包括RPN、RoIAlign层和分类、回归、分割三个分支。在训练时,对正类RoI进行分割,以提高实例分割效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Mask R-CNN简介

       \space\space\space\space\space\space       Mask R-CNN是在Faster R-CNN的基础上,加了一个分割的分支,能够在检测的同时,对各RoI中的目标物体进行分割,即实例分割(instance segmentation)。
       \space\space\space\space\space\space       实例分割是一个比较有挑战性的任务,它既要检测出一幅图中所有的目标物体,又要将它们分割出来。所以实例分割是目标检测与语义分割的组合。
       \space\space\space\space\space\space       由于Faster R-CNN RoI pooling层的原因,最终生成的特征图与原始候选区域并不对应,所以Mask R-CNN并不是简单的增加一个分割分支就可以的,文章设计了一个RoIAlign来解决特征图与原始候选区域对应的ground truth不对齐的问题。RoIAlign不仅大幅提高分割的准确率,而且将实例分割任务成功解耦为分类和二值分割,即对每一个RoI中的物体生成一个二值mask,对应类别由检测网络的分类分支预测。相比直接用全卷积神经网络实例分割(mask对应多类别,相当于在分割同时还要分类),这种解耦的方式效果好很多。

Mask R-CNN细节

Mask R-CNN的网络结构如下图所示。
在这里插入图片描述
       \space\space\space\space\space\space       第一阶段和Faster R-CNN一样,用RPN产生候选区域。第二阶段,在预测每一个RoI类别和bounding box偏移量的同时,生成二值mask分割RoI。
       \space\space\space\space\space\space       在训练期间,每一个RoI的loss计算式为 L = L c l s + L b o x + L m a s k L=L_{cls}+L_{box}+L_{mask} L=Lcls+Lbox+Lm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值