Faster R-CNN——学习笔记~

本文深入探讨了Faster R-CNN中的区域提议网络(RPN)工作原理,指出RPN输入特征图的感受野应大于最大anchor尺寸,以确保前景与背景的有效区分。同时,解析了回归网络的作用及log函数的应用,强调其对不同尺度目标检测精度的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 致谢

感谢网友theoqian的帮助,原文链接如下:

https://www.jianshu.com/p/cbfaa305b887

关于RPN的过程解释的十分通俗易懂!

2 Faster R-CNN的学习笔记

1.1 RPN

记得看一下Detectron2对 Faster R-CNN的实现,RPN的输出中是否包含置信度的评分;

在使用RPN的时候要注意,RPN输入的 feature maps中每个 feature maps的像素点对应的感受野必须要大于最大anchor的尺寸,这样才可以保证,当前点有能力对foreground和background进行区分的能力;

2 备注

2.1 Faster R-CNN的RPN的输入是有问题的

Faster R-CNN中,RPN的输入明显是有问题的,输入特征图中像素点的感受野要小于最大的anchor(512x512),这明显是有问题的,感受野小于anchor,如何能判断这个anchor是否是前景还是后景呢?

2.1 回归网络的产生的原因

回归网络的产生的原因:弥补RP与 Ground Truth之前的差异性;由RP的性质我们可以知道,我们所枚举的RP不可能覆盖 Ground Truth的矩形框所有的情况。

2.2 回归网络为什么要使用log()函数?

回归网络用log()函数,因为大物体我们不介意误差大,但是小物体一定要精确,于是我们使用log()函数对物体的尺寸参数进行一个非线性映射。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值