高层的feature map有更大的感受野,底层的feature map有更小的感受野,这不再赘述。
在高层的feature map每个像素当成一个anchors base,再根据原图压缩至feature map缩小的倍率进行反向倍化,就比如(0,0)倍化还是0,0,(2,2)倍化就是(2倍率,2倍率)坐标了。每个anchors base衍生出9(原论文是9,如果想预测小目标,可以设置更小的长宽)个长宽不等的anchorboxs。
其实每一批次的anchors base坐标点都一样(同一个featuremap),因为featuremap尺寸一样,原图又调整一样。
以下是筛选proposal给fast_rcnn
1)对众多的anchorboxs,进行筛选,筛选出符合要求的proposal。先根据score打分情况排序(就是1*1卷积后的tensor),再根据设定阈值pre_nms=2000,有的特征层生成的anchorsbox可能都不够阈值pre_nms,所以这一层就没筛掉。
2)nms非极大抑制(iou=0.5)proposal彼此之间排斥,再根据设定阈值pos_nms=2000
以下是筛选proposal训练RPN网络

rpn网络
最新推荐文章于 2022-07-26 15:38:49 发布
本文详细介绍了RPN(Region Proposal Network)的工作原理,重点阐述了高层和底层featuremap的感受野差异,以及如何利用这些特征生成anchor boxes。在筛选提案阶段,首先根据得分排序并依据预设阈值保留部分boxes,然后通过NMS去除重叠,最终得到用于fast_rcnn的候选框。整个流程中,关键步骤包括特征提取、anchor生成、筛选和非极大抑制,确保了目标检测的精确性。
1176

被折叠的 条评论
为什么被折叠?



