Faster R-CNN——学习笔记~

songyuc

于 2019-08-31 22:56:26 发布

阅读量157

点赞数

分类专栏： CNN学习目标检测文章标签： Faster RCNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/songyuc/article/details/100178472

版权

目标检测同时被 2 个专栏收录

61 篇文章

订阅专栏

13 篇文章

订阅专栏

本文深入探讨了Faster R-CNN中的区域提议网络(RPN)工作原理，指出RPN输入特征图的感受野应大于最大anchor尺寸，以确保前景与背景的有效区分。同时，解析了回归网络的作用及log函数的应用，强调其对不同尺度目标检测精度的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 致谢

感谢网友theoqian的帮助，原文链接如下：

https://www.jianshu.com/p/cbfaa305b887

关于RPN的过程解释的十分通俗易懂！

2 Faster R-CNN的学习笔记

1.1 RPN

记得看一下Detectron2对 Faster R-CNN的实现，RPN的输出中是否包含置信度的评分；

在使用RPN的时候要注意，RPN输入的 feature maps中每个 feature maps的像素点对应的感受野必须要大于最大anchor的尺寸，这样才可以保证，当前点有能力对foreground和background进行区分的能力；

2 备注

2.1 Faster R-CNN的RPN的输入是有问题的

Faster R-CNN中，RPN的输入明显是有问题的，输入特征图中像素点的感受野要小于最大的anchor(512x512)，这明显是有问题的，感受野小于anchor，如何能判断这个anchor是否是前景还是后景呢?

2.1 回归网络的产生的原因

回归网络的产生的原因：弥补RP与 Ground Truth之前的差异性；由RP的性质我们可以知道，我们所枚举的RP不可能覆盖 Ground Truth的矩形框所有的情况。

2.2 回归网络为什么要使用log()函数？

回归网络用log()函数，因为大物体我们不介意误差大，但是小物体一定要精确，于是我们使用log()函数对物体的尺寸参数进行一个非线性映射。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。