Adaptive NMS: Refining Pedestrian Detection in a Crowd

最新推荐文章于 2025-05-18 15:29:48 发布

原创最新推荐文章于 2025-05-18 15:29:48 发布 · 1.6k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Object Detection 专栏收录该内容

22 篇文章

订阅专栏

博客围绕NMS优化展开，NMS是检测后处理，用于去除冗余矩形框。传统NMS阈值固定不合理，在稠密和稀疏场景各有弊端。ICCV17提出soft NMS，本文继续优化，先估计场景稠密程度再设阈值算分数。最后指出检测各环节有提升空间，小改进也有价值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这两年不少人在做NMS的优化工作。NMS是检测的后处理工作，在RCNN系列算法中，会从一张图片中找出很多个候选框（可能包含物体的矩形边框），NMS就是去除冗余矩形框的过程。具体流程如下：

对于Bounding Box的列表B及其对应的置信度S,采用下面的计算方式.选择具有最大score的检测框M,将其从B集合中移除并加入到最终的检测结果D中.通常将B中剩余检测框中与M的IoU大于阈值Nt的框从B中移除.重复这个过程,直到B为空。

我们发现这个流程中阈值Nt很重要，以前的检测工作中Nt是一个固定值，这个不是很合理，因为实际上存在一些物体的gt矩形框重叠（稠密物体场景），这样NMS中很可能会把正确的框剔除掉。那么我们会想：把这个Nt增大不就好了，可数据集中稀疏场景下，较大的阈值会放掉一些False positive，这样也不是我们想要的结果。自然地，我们想要的是这个阈值自适应的改变：稠密场景下增大，稀疏场景下减小。

ICCV17 soft NMS的工作：

根据iou来改变检测的分数，小于阈值时，分数不变，大于阈值时，减小对应的分数。这里的改进就是减少分数而不是完全置零。 f的具体形式可以是：

本文继续优化soft nms，先估计场景的稠密程度（在RPN上的一个子网络）：

再设置对应阈值，根据阈值计算分数：

其实感觉变动不是很大，但是网络不一定好调试不来。具体网络细节没有太大兴趣了解。

小结：

a. 检测的整个流程中各个环节都有可以提升的空间，同理其他任务也是如此，分析这些环节中存在那些不够完善的点，想办法改进；

b. 不用担心一定要做出多大变动才能叫创新，科研本来就是一点点的探索，一点改进如果是扎实的，那么它就有自己的价值。

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。