基于多列卷积神经网络的单图像人群计数(人群计数)

文章Single-Image Crowd Counting via Multi-Column Convolutional Neural Network

介绍:

本文旨在开发一种方法,具有任意人群密度和仁义视角的单个图像精度估计人群数量。提出了一种MCNN的方法,输入的图像任意大小和任意分辨率,通过不同尺寸的感受野的滤波器,由每列cnn学习的特征适应于由于透视效果和图像分辨率引起的人/头部尺寸的变化,

本文解决的问题:

前景分割很难,人群遮挡严重,图像人的多少不太固定。

前景分割是当前大多数工作中不可缺少的部分。 然而,前景分割本身就是一项具有挑战性的任务,不准确的分割将对最终的计数产生不可逆转的不利影响。 在我们的任务中,图像的视点可以是任意的。 如果没有关于场景几何或运动的信息,就几乎不可能从背景中准确地分割出人群。 因此,我们必须估计人群的数量,而不是首先分割前景

在我们的任务(或数据集)中,人群的密度和分布发生了显著的变化,并且通常在每幅图像中对大多数人都有巨大的遮挡。 因此,传统的基于检测的方法不能很好地处理这些图像和场景

由于图像中人的尺度可能有很大的变化,我们需要一起使用不同尺度上的特征,以便准确地估计不同图像的人群数量。 由于我们没有被跟踪的特征,并且很难为所有不同的尺度手工制作特征,所以我们不得不求助

本文的主要贡献:

  1. 我们在此采用多列架构的原因是相当自然的:三列对应于具有不同大小(大、中、小)的接收场的滤波器,使得每个列CNN学习的特征能够适应(因此整个网络对)由于透视效果或跨不同图像分辨率而引起的人/头大小的大变化(因此是鲁棒的)
  2. 在MCNN中,我们用滤波器尺寸为1×1的卷积层代替完全连接层。 因此,我们的模型的输入图像可以是任意大小的,以避免失真。 网络的直接输出是对人群密度的估计,我们从人群密度中得出总人
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值