多视角行人检测方法综述
1. 现有行人检测方法
- Faster R - CNN方法 :Faster R - CNN在地面上部分遮挡行人的定位方面不够稳健,因此在多视角行人检测任务中的表现平平。
- Lopez - Cifuentes等人的方法 :提出了一种基于语义分割网络和目标检测网络的行人检测方法。
- 语义分割网络用于分割行人区域和场景背景,将与地面相关的区域类别投影到顶视图并组合形成感兴趣区域(AOI)。
- 目标检测网络提取每个视图中不同行人的位置,将每个检测到的行人边界框的底点投影到地平面,并与其他视图投影的底点进行聚类。
- 该方法需要比其他基于深度学习的方法更多的GPU资源,因为它同时使用了目标检测网络和语义分割网络。
- Deep Occlusion方法 :由Baque等人提出,是一种基于深度学习且类似POM的网络。
- 将各个视图输入CNN网络提取特征,高斯网络将提取的特征分类为行人的八个身体部位类别。
- 以类似POM的方式融合多视图信息,离散化地平面上的每个网格单元在每个视图中都有一个对应平均行人高度的边界框。
- 将生成的边界框与每个视图中的八个身体部位类别进行匹配,以获得每个边界框包含行人的概率。
- 将地平面上的整体占用问题转化为能量最小化问题,可通过条件随机场(CRF)解决,在EPFL Wildtrack数据集上表现良好。
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



