How Far are We from Solving Pedestrian Detection?

本文分析了行人检测领域的最新进展,并通过建立人类基线对比算法性能,指出定位错误和背景干扰是主要挑战。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原文链接 http://blog.youkuaiyun.com/cv_family_z/article/details/52119644


CVPR 2016 我们离解决行人检测问题到底还有多远?

How Far are We from Solving Pedestrian Detection? 
项目网页:https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/people-detection-pose-estimation-and-tracking/how-far-are-we-from-solving-pedestrian-detection/

Matlab code: https://bitbucket.org/shanshanzhang/code_filteredchannelfeatures

行人检测问题一直是一个比较热门的研究话题,行人检测最近几年进步比较大,那么还有多大的提升空间了?最近建立了一个 human baseline(人自己去看,来框出行人),发现大约目前最先进的算法与人工检测差 10%。

这里写图片描述

于是我们分析了一下目前算法主要存在的问题,找出改进的空间:1) high confidence false positives 一个主要因素是 localisation ,这里我们通过改进 training set alignment quality 来解决;2) 背景的干扰,通过深入分析CNN网络来改进

这里我们首先建立了一个 human baseline, 这是我们的终极目标,达到或者超过人工检测率。

这里写图片描述

这里写图片描述

3.2. Failure analysis

紧接着我们分析了一下 当前最好的算法检测失败的原因 
这里写图片描述 
这里写图片描述

Conclusion: For most top performing methods localisation and background-vs-foreground errors have equal impact on the detection quality. They are equally important.

3.3. Improved Caltech-USA annotations 
原来的数据库真值有不太准确的地方,我们对此进行了改进。

4.1. Impact of training annotations 
这里写图片描述

4.2. Convnets for pedestrian detection

这里写图片描述

这里写图片描述

Conclusion :CNN网络在图像分类和广义目标检测问题显示出很强的能力,但是针对小目标检测定位问题表现的不是很好,加入了Bounding box regression (and 
NMS)有所改善,但是 背景的干扰仍然是检测失败主要的原因。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值