Pedestrian Detection: An Evaluation of the State of the Art

本文是对行人检测领域的评估,分析了Caltech数据集的获取和处理,包括数据去抖动、标注方法。评估方法涉及全图评估,如log-average miss rate与FPPI,以及两种过滤策略。介绍了多种算法,如多尺度Haar小波、Viola-Jones、HOG特征,还有DPM和poselet。此外,还列举了一些相关网站和知名研究者。

Pedestrian Detection: An Evaluation of the State of the Art


前言

本文是阅读piotr的PAMI2011文章《Pedestrian Detection: An Evaluation of the State of the Art》的摘要和感想,文章中的Caltech数据集以及代码可以在项目主页上得到。

关于数据的获取和数据分析

  • Caltech行人检测数据集数据的取得是通过车在摄像头在城市里拍摄的视频得到的,拍摄的视频通过Lucas-kanade方法去抖动(可以参考:S. Baker and etc., “Lucas-kanade 20 years on: A unifying framework,” IJCV 2004)
  • 标注数据的时候,每间隔几帧标注一次,中间的数据通过插值(cubic interpolation)得到(效果比跟踪更好)
  • 标注的包围盒(bound box)的高度呈现lognormal分布(求对数之后呈正太分布)
  • 很多标注的行人都有遮挡的情况,遮挡的部位往往不是随机的,而且遮挡的模式也就是固定的几种
  • 由于采用车载设备拍摄,行人在图像中的位置一般都集中在某些区域(可以通过添加这个限制来加速行人检测)
  • selection bias:用照片或是监控视频作为数据集的时候,由于照片一般是人摆放好姿势拍摄的,而监控视频中背景是不动的,从而会添加额外的限制,而用车载设备拍摄则不会这样。

评估方法

  1. Full Image Evaluation:
    BBdt :detected bound box
    BBgt :ground truth bound box
    当重叠的面积大于0.5时,即
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值