23、目标检测算法:R-CNN、Mask R-CNN与YOLO的深入解析

目标检测算法:R-CNN、Mask R-CNN与YOLO的深入解析

1. ROI池化与Faster R-CNN

ROI(Region of Interest)池化能够将任意感兴趣区域转换为指定大小的特征向量,而不受该区域高度和宽度的影响。例如,若有一个8×16的特征图区域,要将其缩减为4×4,可把8×16的区域划分为4×4的网格,每个网格单元大小为2×4,接着取每个单元中八个值的最大值,将这些最大值填入4×4的网格,这就是ROI池化,简单、快速且有效,适用于任何大小和宽高比的区域。

2016年,一篇名为“Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”的论文通过用区域提议网络(RPN)取代选择性搜索,进一步提升了性能。RPN是一个浅层卷积神经网络(CNN),与主CNN共享层。为生成区域提议,它会在最后共享层生成的特征图上滑动一个窗口,在窗口的每个停留点,RPN会评估n个候选区域(称为锚点或锚框),并根据与真实框的交并比(IoU)分数为每个区域计算目标性得分。目标性得分和锚框会输入到全连接层进行分类(锚框中是否包含对象,若包含,是什么类型)和回归。这些层的输出最终确定投影到主CNN生成的特征图上的感兴趣区域,并将其转发到ROI池化层。

Faster R-CNN的速度比Fast R-CNN快10倍,能近乎实时地进行目标检测。由于RPN识别候选区域的能力更强,它通常也比Fast R-CNN更准确。选择性搜索是静态的,而RPN会随着网络训练变得更智能。此外,RPN与主CNN并行执行,这意味着区域提议对性能的影响很小。

2. Mask R-CNN
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值