Faster RCNN论文理解

本文深入解析FasterRCNN的运行机制,包括特征映射生成、锚点(anchors)的设定与滑动、正负样本选取、感兴趣区域(ROIs)生成及RoiPooling过程。FasterRCNN通过两阶段方法提升目标检测效率,先由RPN生成候选区域,再经Fastrcnn精确定位与分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Faster RCNN论文理解
代码地址

  • 首先通过网络来生成feature map(例如vgg16),然后通过RPN生成anchors,anchors是人为设定的候选框(拥有一定的尺度和比率,例如尺度为3,比率为3,那么anchor就有9个),然后拿每个anchors的中心点在feature map上的每个像素点上滑动,就可以得到20000多个anchors,anchors在feature map上滑动对应代码如下(proposal_layer.py里面):
shift_x = np.arange(0, feat_width) * self._feat_stride   # np.arange(0, feat_width)产生0-feat_width之间的整数;遍历feature map
shift_y = np.arange(0, feat_height) * self._feat_stride
shift_x, shift_y = np.meshgrid(shift_x, shift_y)
shifts = torch.from_numpy(np.vstack((shift_x.ravel(), shift_y.ravel(),
                                  shift_x.ravel(), shift_y.ravel())).transpose())
shifts = shifts.contiguous().type_as(scores).float()
A = self._num_anchors # anchors数量
K = shifts.size(0) # shifts里面元素个数
self._anchors = self._anchors.type_as(scores) # 将_anchors转化为scores的类型
anchors = self._anchors.view(1, A, 4) + shifts.view(K, 1, 4)  # self._anchors是人工生成的anchors,加上shifts,相当于加上了一个偏移量,实现了在feature map上的滑动
  • RPN包括AnhorTargetCreator和ProposalCreator。
    在这里插入图片描述
  • 然后通过AnhorTargetCreator从20000多个anchors中抽取256个正负样本,用于RPN网络的训练。抽取规则是:1>对于每一个ground truth bounding box (gt_bbox),选择和它重叠度(IoU)最高的一个anchor作为正样本。2>对于剩下的anchor,从中选择和任意一个gt_bbox重叠度超过0.7的anchor,作为正样本,正样本的数目不超过128个。3>随机选择和gt_bbox重叠度小于0.3的anchor作为负样本。负样本和正样本的总数为256。注意:AnhorTargetCreator只在训练中使用。相应代码在anchor_target_layer.py里面。
  • 第一步生成的anchors,通过ProposalCreator来生成rois(region of interests,个人理解,感兴趣区域,即类似于聚类的好多候选框组成的区域,一个区域对应一个目标),生成过程如下:1>计算20000多个anchors属于前景的概率,然后选择概率最大的前12000个,并使用回归量来修正rois。2>使用NMS得到2000个rois。注意:ProposalCreator训练测试都会使用代码里面的实现过程是这样的:首先根据box偏移量对20000多个anchors进行修正,然后计算20000多个anchors属于前景的概率,对概率从大到小排序,取出前12000个,然后进行NMS,保留前2000个,得到Rois。相应代码在anchor_target_layer.py、proposal_layer.py里面。
  • Fast rcnn阶段。RPN生成的rois,通过Proposal Target Creator,从2000个rois中选128个rois,然后通过Roi Pooling,用于训练Fast rcnn.注意:Proposal Target Creator只在训练中使用。相应代码在proposal_target_layer_cascaded.py里面。
  • 在RPN的时候,已经对anchor做了一遍NMS,在Fast rcnn测试的时候,还要再做一遍
  • 在RPN的时候,已经对anchor的位置做了回归调整,在Fast rcnn阶段还要对RoI再做一遍
  • 在RPN阶段分类是二分类(前景/背景),而Fast RCNN阶段是21分类(voc数据集中的20个类加上背景类)

参考
[论文解读]https://zhuanlan.zhihu.com/p/31426458
https://zhuanlan.zhihu.com/p/32404424
[anchor解读]https://blog.youkuaiyun.com/ture_dream/article/details/76824889
[ROI POOLING详解]https://blog.youkuaiyun.com/auto1993/article/details/78514071

JFM7VX690T型SRAM型现场可编程门阵列技术手册主要介绍的是上海复旦微电子集团股份有限公司(简称复旦微电子)生产的高性能FPGA产品JFM7VX690T。该产品属于JFM7系列,具有现场可编程特性,集成了功能强大且可以灵活配置组合的可编程资源,适用于实现多种功能,如输入输出接口、通用数字逻辑、存储器、数字信号处理和时钟管理等。JFM7VX690T型FPGA适用于复杂、高速的数字逻辑电路,广泛应用于通讯、信息处理、工业控制、数据中心、仪表测量、医疗仪器、人工智能、自动驾驶等领域。 产品特点包括: 1. 可配置逻辑资源(CLB),使用LUT6结构。 2. 包含CLB模块,可用于实现常规数字逻辑和分布式RAM。 3. 含有I/O、BlockRAM、DSP、MMCM、GTH等可编程模块。 4. 提供不同的封装规格和工作温度范围的产品,便于满足不同的使用环境。 JFM7VX690T产品系列中,有多种型号可供选择。例如: - JFM7VX690T80采用FCBGA1927封装,尺寸为45x45mm,使用锡银焊球,工作温度范围为-40°C到+100°C。 - JFM7VX690T80-AS同样采用FCBGA1927封装,但工作温度范围更广,为-55°C到+125°C,同样使用锡银焊球。 - JFM7VX690T80-N采用FCBGA1927封装和铅锡焊球,工作温度范围与JFM7VX690T80-AS相同。 - JFM7VX690T36的封装规格为FCBGA1761,尺寸为42.5x42.5mm,使用锡银焊球,工作温度范围为-40°C到+100°C。 - JFM7VX690T36-AS使用锡银焊球,工作温度范围为-55°C到+125°C。 - JFM7VX690T36-N使用铅锡焊球,工作温度范围与JFM7VX690T36-AS相同。 技术手册中还包含了一系列详细的技术参数,包括极限参数、推荐工作条件、电特性参数、ESD等级、MSL等级、重量等。在产品参数章节中,还特别强调了封装类型,包括外形图和尺寸、引出端定义等。引出端定义是指对FPGA芯片上的各个引脚的功能和接线规则进行说明,这对于FPGA的正确应用和电路设计至关重要。 应用指南章节涉及了FPGA在不同应用场景下的推荐使用方法。其中差异说明部分可能涉及产品之间的性能差异;关键性能对比可能包括功耗与速度对比、上电浪涌电流测试情况说明、GTH Channel Loss性能差异说明、GTH电源性能差异说明等。此外,手册可能还提供了其他推荐应用方案,例如不使用的BANK接法推荐、CCLK信号PCB布线推荐、JTAG级联PCB布线推荐、系统工作的复位方案推荐等,这些内容对于提高系统性能和稳定性有着重要作用。 焊接及注意事项章节则针对产品的焊接过程提供了指导,强调焊接过程中的注意事项,以确保产品在组装过程中的稳定性和可靠性。手册还明确指出,未经复旦微电子的许可,不得翻印或者复制全部或部分本资料的内容,且不承担采购方选择与使用本文描述的产品和服务的责任。 上海复旦微电子集团股份有限公司拥有相关的商标和知识产权。该公司在中国发布的技术手册,版权为上海复旦微电子集团股份有限公司所有,未经许可不得进行复制或传播。 技术手册提供了上海复旦微电子集团股份有限公司销售及服务网点的信息,方便用户在需要时能够联系到相应的服务机构,获取最新信息和必要的支持。同时,用户可以访问复旦微电子的官方网站(***以获取更多产品信息和公司动态。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值