【深度学习】目标检测网络结构MASK RCNN FPN

本文介绍了 Mask RCNN 相对于 Faster RCNN 的改进,包括分割、检测、分类同时进行,引入 ROI ALIGN 代替 ROI POOLING 以提高小目标检测精准度,引入语义分割分支解耦 mask 和 class 预测关系。还提到 FPN 可结合多种方法获强语义特征,提升目标检测和实例分割性能,且能应用于多种网络结构。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

其相对于FASTER RCNN改进如下:

1. 分割,检测,分类同时进行

2. 引入ROI ALIGN(对分类影响不大,对分割影响大,因为ROI POOLING对应回图像中的像素会有偏差,该方法会相对准确)代替faster rcnn中的ROI POOLING

ROI ALIGN: https://www.cnblogs.com/wangyong/p/8523814.html

对于检测图片中大目标物体时,两种方案的差别不大,而如果是图片中有较多小目标物体需要检测,则优先选择RoiAlign,更精准些

3. 引入语义分割分支,实现mask和class预测关系的解耦。mask分支只做语义分割,类型预测的任务交给另一个分支(与FCN不同:FCN分类与分割同时,预测分割的时候也预测分类,不同的channel是不同的类别的分割概率)

 

 

FPN通过结合bottom-up,top-down方法获得较强的语义特征,提高目标检测和实例分割在多个数据集上面的性能表现。

FPN可以应用到前边的网络结构(fast, faster, mask rcnn)中

FPN: https://blog.youkuaiyun.com/WZZ18191171661/article/details/79494534

MAP: https://www.cnblogs.com/klitech/p/9242700.html

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值