Pedestrian Detection: An Evaluation of the State of the Art
前言
本文是阅读piotr的PAMI2011文章《Pedestrian Detection: An Evaluation of the State of the Art》的摘要和感想,文章中的Caltech数据集以及代码可以在项目主页上得到。
关于数据的获取和数据分析
- Caltech行人检测数据集数据的取得是通过车在摄像头在城市里拍摄的视频得到的,拍摄的视频通过Lucas-kanade方法去抖动(可以参考:S. Baker and etc., “Lucas-kanade 20 years on: A unifying framework,” IJCV 2004)
- 标注数据的时候,每间隔几帧标注一次,中间的数据通过插值(cubic interpolation)得到(效果比跟踪更好)
- 标注的包围盒(bound box)的高度呈现lognormal分布(求对数之后呈正太分布)
- 很多标注的行人都有遮挡的情况,遮挡的部位往往不是随机的,而且遮挡的模式也就是固定的几种
- 由于采用车载设备拍摄,行人在图像中的位置一般都集中在某些区域(可以通过添加这个限制来加速行人检测)
- selection bias:用照片或是监控视频作为数据集的时候,由于照片一般是人摆放好姿势拍摄的,而监控视频中背景是不动的,从而会添加额外的限制,而用车载设备拍摄则不会这样。
评估方法
- Full Image Evaluation:
BBdt :detected bound box
BBgt :ground truth bound box
当重叠的面积大于0.5时,即