利用部分头部信息实现观众人群图像中的人体检测
在图像理解领域,人体检测有着广泛的应用,像监控、群体行为建模、语义上下文提取以及人群灾难预防等。然而,在观众人群图像里进行人体检测却极具挑战性,因为人群数量众多、人体部分尺寸小且存在遮挡。
人体检测方法概述
人体检测技术主要有自上而下和自下而上两种途径:
- 自上而下方法 :直接从图像中检测完整人体,不检测人体的各个部分。但在人体有重叠的情况下,由于遮挡问题,很难检测到完整的人体,所以在密集人群图像中不太适用。
- 自下而上方法 :先定位人体的各个部分,再将它们组合成完整的人体。不过,这种方法存在关节配对和计算复杂度高的问题。随着图像中人数的增加,潜在的关节对数量会呈指数级增长,而且在密集人群中,错误配对的可能性也很高,同时人体部分的遮挡还会进一步降低检测效果。
观众人群场景的特点
以体育场的观众人群为例,这是一种典型的密集人群场景。从正面拍摄的人群图像中,观众的头部通常是露出的,且尺寸变化有限,但后面观众的身体会被前面的观众遮挡,导致可见身体部分存在差异。此外,体育场的人群大多时候处于坐姿,身体运动水平较低,这与行人等其他人群场景不同,因此依赖人体运动信息的检测技术,如行人检测技术,并不适用于观众人群视频的检测。所以,需要一种基于图像的检测技术,它既不需要运动信息,又能处理人数/部分增加、人体遮挡和低图像分辨率等问题。
图像检测面临的挑战
基于图像的头部和人体检测由于身体部分的低分辨率而具有挑战性。低分辨率减少了图像中详细面部和身体特征的可用性,因此需要依靠不依赖详细形状可见性的检测技术
超级会员免费看
订阅专栏 解锁全文

11

被折叠的 条评论
为什么被折叠?



