Faster -RCNN算法笔记

最新推荐文章于 2025-02-23 10:44:37 发布

原创

最新推荐文章于 2025-02-23 10:44:37 发布 · 2.3k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文详细介绍了Faster R-CNN算法，重点讲解了Region Proposal Network（RPN）的工作流程、训练方法以及损失函数。RPN通过全卷积网络生成候选框，与Fast R-CNN结合，实现目标检测的实时性能。训练过程采用端到端方式，通过调整正负样本比例和优化算法，确保网络性能。

论文：Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

论文采用RPN(区域建议生成网络)来生成候选框，RPN网络与检测网络共享完整的图像卷积特征，大大减少了生成候选框所需的时间。RPN是一个全卷积网络，它同时预测每个位置的目标边界并给出所属类别的置信度（score）。RPN经过端到端的训练，生成候选框并对其进行条件筛选然后用于Fast R-CNN检测。

简单来说就是：

Faster RCNN算法将RPN和Fast-RCNN结合，由RPN负责候选框的提取，Fast R-CNN负责检测模块，对RPN提取的候选框检测并识别框中的目标,整个流程如下图所示。

RPN（Region Proposal Network）

RPN的作用是输入一张图像，输出一批矩形候选框，类似于以往目标检测中的selective search，网络结构是基于卷积神经网络，但输出包含二分类softmax和bbox回归的多任务模型。

RPN具体流程

使用一个小网络在最后卷积得到的特征图上进行滑动扫描，特征图上的每一个点都对应有9个不同的anchor。在这个滑动网络每次与特征图上n*n的窗口全连接，然后映射到一个低维向量，最后将这个低维向量送入到两个全连接层，即box回归层和box分类层。如下图来自论文。

RPN网络的训练

RPN网络的训练采用反向传播算法和随机梯度下降算法进行端到端的训练方式。依照Fast R-CNN中的“image-centric”采样策略训练这个网络。每个mini-batch由包含了许多正负样本的单个图像组成。我们可以优化所有anchor的损失函数，但是这会偏向于负样本，因为正负样本主要根据IOU值大小的来标定的，这样一来负样本就比较多。

正负样本的判定：

某anchor与任一目标区域的IOU最大，则判为目标
某anchor与任一目标区域的IOU>0.7则判定有目标，即正样本
某anchor与任一目标区域的IOU<0.3则判为背景，即负样本

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

SuperLee188 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。