提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
前言
Faster RCNN 由 论文提出,是继R-CNN和Fast RCNN之后的目标检测上的又一力作。
R-CNN提出selective search(SS)来搜索region proposal(RP);
Fast RCNN指出不必对每个RP各自提CNN特征,可以对原图提好CNN特征,再将SS找到的RP映射到CNN特征层上;
Faster RCNN则提出了RPN层,将特征提取,proposal提取,bounding box整合在了一个网络中,极大地提高了检测速度。
1. 框架与流程
Faster RCNN的模型框架如图。

可以分为4个主要内容:
- Conv layers。作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。
- Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative,再利用bounding box regression修正anchors获得精确的proposals。
- Roi Pooling。该层收集输入的feature maps和proposals,综合这些信息后提取proposal feature maps,送入后续全连接层判定目标类别。
- Classification。利用proposal feature maps计算proposal的类别,同时再次bounding box regression获得检测框最终的精确位置。
完整的网络图如下。

- 该网络对于一副任意大小PxQ的图像,首先缩放至固定大小MxN,然后将MxN图像送入网络;
- Conv layers中包含了13个conv层+13个relu层+4个pooling层;
- RPN网络首先经过3x3卷积,再分别生成positive anchors和对应bounding box regression偏移量,然后计算出proposals;
- Roi Pooling层则利用proposals从feature maps中提取proposal feature送入后续全连接和softmax网络作classification。

Faster R-CNN是目标检测领域的重要进展,它结合了RPN(Region Proposal Network)和RoIPooling,实现了目标检测的端到端训练。RPN通过softmax分类和bounding box regression生成region proposals,RoIPooling则将不同尺寸的proposals转换为固定大小,供后续全连接层进行分类和进一步的bounding box regression。整个网络经过两次交替训练,显著提高了检测速度和精度。
最低0.47元/天 解锁文章
5193

被折叠的 条评论
为什么被折叠?



