
Crowd density estimation
Yunpeng1119
这个作者很懒,什么都没留下…
展开
-
Spatial Uncertainty-Aware Semi-Supervised Crowd Counting
提出的空间不确定性感知师生框架关注高置信度区域的信息,同时以端到端的方式处理来自未标注数据的噪声监督。提出一种基于正则化代理任务(二值分割)的空间不确定性感知半监督方法。考虑空间不确定性的半监督人群计数。原创 2022-10-30 14:59:16 · 246 阅读 · 1 评论 -
注意力机制
处理信息时会过滤掉不太关注的信息、着重于感兴趣信息的机制称为。在计算机视觉领域,按照注意力关注的域,可以将其分成。自下而上无意识、由外界刺激引发的注意力称为。自上而下有意识地聚焦称为。原创 2022-10-28 17:51:33 · 760 阅读 · 0 评论 -
Exploiting sample correlation for crowd counting with multi-expert network
为了获得由相似的样本组成的聚类,基于协同微调相似性设计了一种简单的聚类方法来在密集的人群数据集中发现潜在的聚类,然后每个聚类用于获得专家的参数。),可以反应最优专家参数之间的相关性(可以近似地描述在包含这两个样本的子集上进行微调之后模型的性能改进)。为了获得有效的专家,大多数专家计数方法采用了差分训练技术(只是减少了对当前样本最准确预测的专家的损失)每个专家都是通过在训练数据的子集上微调模型而产生的。为了减少参数的储存空间和避免对聚类的过度拟合,设计了一个简单而有效的人群计数模型(探索了如何有效的使用。原创 2022-10-26 21:50:53 · 421 阅读 · 0 评论 -
Counting Varying Density Crowds Through Density Guided Adaptive Selection CNN and Transformer Estim
提出了一种CNN和Transformer自适应选择网络(CTASNet),该网络可以针对不同密度区域自适应选择适当的计数支路。首先,CTASNet生成CNN和Transformer的预测结果。然后,考虑到CNN/Transformer适用于低密度/高密度区域,设计了密度引导的自适应选择模块,以自动组合CNN和Transformer的预测,此外,为了减少注释噪声的影响,我们引入了基于相关熵的最优传输损耗。CNN和Transformer自适应选择网络(CTASNet),该框架能够在低密度区域自适应定位目标,并在原创 2022-09-16 11:16:56 · 383 阅读 · 1 评论 -
Boosting Crowd Counting via Multifaceted Attention
提出了一种多方面注意网络(MAN)来改进局部空间关系编码中的transformer模型。MAN将来自vanilla transformer的全局注意力、可学习的局部注意力和实例注意力合并到一个计算模型中。原创 2022-09-16 11:14:30 · 1008 阅读 · 0 评论 -
CrowdFormer
提出了一种使用金字塔vision transformer的弱监督人群计数方法。利用金字塔vision transformer提取具有全局上下文的多尺度特征,提出了一个有效的特征聚合模块,将来自transformer不同阶段的特征和一个简单的回归头结合起来,以估计人群数量。原创 2022-09-16 11:11:17 · 271 阅读 · 0 评论 -
Boosting Crowd Counting with Transformers
研究了全局上下文在人群计数中的作用。提出了两个新的模块:token注意模块(TAM)和回归token模块(RTM)。引入token注意模块(TAM)来细化由上下文token通知的编码特征。使用回归token模块(RTM)进一步指导上下文token的学习,该模块在人群总数的回归中容纳辅助损失提出的TAM模块旨在解决vision transformer中的多头自注意力(MHSA)仅模拟空间交互的观察问题,而经过验证的真实通道交互也被证明具有至关重要的有效性。为此,TAM通过特征通道的条件重新校准将上原创 2022-09-16 11:09:34 · 281 阅读 · 0 评论 -
Congested Crowd Instance Localization with Dilated Convolutional Swin Transformer
提出了一种将transformer和传统卷积网络方法相结合的方法来解决人群定位的密集预测问题。在Swin Transformer主干中,在不同阶段插入两个扩展卷积块以扩大感受野,这有效地提高了特征提取的能力,尤其是对于人群场景中的微小对象、相互遮挡和模糊区域。原创 2022-09-16 11:07:57 · 602 阅读 · 0 评论 -
An End-to-End Transformer Model for Crowd Localization
将人群定位视为一个直接集预测问题,将提取的特征和可训练的嵌入作为transformer解码器的输入。为了获得良好的匹配结果,引入了一种基于KMO的匈牙利算法,它创新性地从上下文视图而不是独立的实例视图重新访问标签分配。原创 2022-09-16 11:06:04 · 1510 阅读 · 6 评论 -
Joint CNN and Transformer Network via weaklysupervised Learning for efficient crowd counting
提出了一种用于有效弱监督人群计数的联合CNN和Transformer学习网络,称为JCTNet。该模型包括三个部分:CNN特征提取模块(CFM)用于提取群组语义信息,Transformer提取模块(TFM)用于捕获全局上下文并彻底学习前景和背景之间的对比特征,计数回归模块(CRM)用于估计最终人数。大量实验和可视化结果表明,该JCTNet在五个主流数据集上都是有效的。原创 2022-09-16 11:04:20 · 286 阅读 · 0 评论 -
CCTrans: Simplifying and Improving Crowd Counting with Transformer
提出了一种在弱监督和完全监督设置下进行人群计数的简单传输路径。该传输路径包含四个组件:一个金字塔Vision Transformer,用于更好地捕捉全局上下文;一个金字塔特征聚合(PFA)模块,结合低层和高层特征,充分利用从粗到细的信息;多尺度扩展卷积(MDC)的高效回归头来用于提供多尺度感受野,预测密度图;尾损失函数,用于稳定训练过程。原创 2022-09-16 11:01:44 · 1039 阅读 · 0 评论 -
TransCrowd: Weakly-Supervised Crowd Counting with Transformer
从序列到计数的角度重新表述了计数问题,并提出了一种弱监督计数方法,该方法仅利用计数级注释,在训练阶段不使用点级信息。与弱监督方法相比,该方法实现了最先进的计数性能。此外,与全监督计数方法相比,我们的方法具有高度竞争性的计数性能。当前弱监督计数方法采用CNN,而CNN感受野有限。未来,我们计划使用Transformer架构实现。全监督计数,并将其扩展到基于视频的计数任务。可以产生更合理的注意力权重,并。提供了两种不同类型命名为。更快的收敛和更高的计数性能。ransformer的。原创 2022-09-16 10:58:27 · 654 阅读 · 0 评论