人流密度估计调研报告

本文调研了人群密度估计技术,包括直接和间接估计方法,重点关注了多尺度卷积网络(MSCNN)、Multi-Column CNN(MCNN)、CrowdNet等模型。MCNN在一般情况下的预测准确率可达93%,而CrowdNet在密集人群估计中表现更优。还讨论了透视变换、遮挡问题和尺度变化的挑战,以及前景分割、特征提取和人数回归等步骤。建议首先采用MCNN模型,并考虑利用透视变化的思想进行优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.1人群聚集程度技术方案调研
常见问题:
a)低分辨率:可以看看UCF Crowd Counting 50这个数据集,在很多密集的情况下,一个人头的pixel可能只有5*5甚至更小,这就决定了基于检测的很多方法都行不通;
b)遮挡严重:在人群中,头肩模型都难以适用更不用说人体模型,头部之间的遮挡都挺严重;
c)透视变换:简而言之就是近大远小,什么尺度的头部都可能出现。
1.1.1.人群聚集程度估计的方案
①直接估计(该方法暂时不考虑)
直接估计就是以检测为主,通过对检测到的人的图像距离进行判断或者通过检测到的人的数量进行判断,是否为聚集程度较高人群。这种方法在一些低密度且人头或者目标人大小较为合适的情况下还是能得到不错的效果。
如下图所示可以根据图像上距离较近的人的人数来评估其是否为聚集性人群;

②间接估计
基本是以特征提取+回归结构为主,
大致步骤为:前景提取、体征提取、回归计数

现有人群密集程度评估模型及模型进行部署方案评估
1、MSCNN
多尺度卷积实现密集人群计数的经典之作,该网络以多尺度团为基础,能够在单列结构中生成与尺度相关的特征,从而获得较高的人群计数性能。

开源代码连接:https://github.com/Ling-Bao/mscnn
有数据集(百度网盘)
所用框架为:tensorflow
2、Single Image crowd counting using Multi-Column CNN(MCNN)
使用的框架为tensorflow,主要解决的是任意相机与任意角度图像的密集人群计数面临的难题,主要思想为从对密集人群分布、前景提取、人群分割等角度来解决密集人群计数的难题,主要的网络结构为:MCNN,模型结构示意图如图下所示

该网络模型适用于有效地捕获高级语义信息(面部/身体检测器)和低级特征(斑点检测器),这一点对于大规模变化下的人群计数是必需的。
该方法的缺点是在人群重叠度较大时效果不好;
有开源代码:https://github.com/aditya-vora/crowd_counting_tensorflow
有训练数

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值