What Can Help Pedestrian Detection?
CVPR2017
本文主要分析 extra features 对于 基于CNN 的行人检测有什么帮助,设计了一个行人检测网络 HyperLearner 可以有效利用这些 extra features
这里的 extra features 主要指 various channel features
行人检测中存在什么问题了?
一个是低分辨率情况的 背景和小尺寸的人 很难区分,另一个是多个人在一起的时候基于CNN的单个行人的检测定位误差相对较大
这里我们将 channel features 融入到 Faster R-CNN 中去
3.2. Introduction to channel features
各种 channel features 分为三类: apparent-to-semantic channels, temporal channels and depth channels
1) apparent-to-semantic channels 主要包括 ICF channel [10]( colors and gradients), edge channel, segmentation channel ( FCN )and heatmap channel( blur the segmentation channel ),特征从 low-level apparent to high-level semantic
2) Temporal channels 包括 optical flow [1] and motion [29]
3)Depth channels disparity channel
分割信息对行人检测的帮助最大
HyperLearner 网络
这里的 Aggregated activation map 是怎么得到了? 将 body network 中不同尺寸的特征图归一化到同一个尺寸、相同通道数目,组合起来得到 Aggregated activation map,这个 Aggregated activation map 作为 channel feature network (CFN) 的输入得到 Channel Feature,body network 的最终输出 加上 Aggregated activation map 作为 region proposal network (RPN) and Fast R-CNN (FRCNN) 的输入。
Caltech test set

本文探讨了额外特征(extrafeatures)如何提升基于CNN的行人检测效果,特别是针对低分辨率背景及多行人场景下的检测难题。通过引入多种通道特征(channelfeatures)至Faster R-CNN框架,提出了一种新的检测网络HyperLearner,并验证了分割信息对检测性能的显著提升。
1089

被折叠的 条评论
为什么被折叠?



