How Far are We from Solving Pedestrian Detection?

摘要


作者从 传统方法 和 最近比较火的convnets 来分析当前行人检测出错的地方,错误主要包括两种:定位(localisation)错误;和前景背景区分错误。并提出了一个经过新的校准的Caltech dataset.


一、引言


1. 定位问题是 导致high confidence的虚警的重要原因,解决这个问题的途径是提高训练集的标注信息的准确度;前景背景的区分度可以通过研究convnets来找到影响因素。

2. 在过去几年,大多数方法都是基于 ICF 框架的衍生。许多研究重心都在improved features,以得到更好的performance.而加入optical flow 和context information也有助于提高检测准确度。

3. 另一个框架就是convnet了,基于目标检测的框架做fine-tuning。


二、正文前言


1. Caltech dataset, MR标准,FPPI.

2. Filtered channel feature detectors中,目前最好的是Checkerboards detector,他也是ICF的一种衍生,对HOG+LUV feature channels进行 filter,然后用boosted decision forest 训练。RotatedFilters是简化版的LDCF,比Checkerboards的准确度差1pp,但是快6倍。


三、the state of the art 方法的分析


1.检测错误有两种,一种是false positives,把background当行人;或对行人的定位不准确。另一种是false negatives,行人的得分较低,或直接被missing.

其中,FP errors又可分为三种,详情如下图:


FN 如下:



综上,FP中定位问题包括对一个行人有重复的BB,这个可通过一些策略或NMS来解决。FN的小尺寸和遮挡问题有待提高。


四、提高the state of art


1.  定位和前景背景错误都很重要,在原dataset 上,去除一些错误的标注,和校准一些不太准确的标注,都有助于提高检测质量。

2. convnet 在图像分类和目标检测上性能很好,但对于小物体的定位还有一定的局限性,可能与pooling有关系,这时候bb regression和NMS就显得比较重要。而前景背景的区分度上也有待提升,说明convnet对于分类还有提升空间。


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值