与白翔组的分尺度预测人群密度有点类似。感觉还是挺有效的,这种思想是否可以借鉴到其他领域中去呢?
论文地址:http://openaccess.thecvf.com/content_CVPR_2020/papers/Jiang_Attention_Scaling_for_Crowd_Counting_CVPR_2020_paper.pdf
Abstract:
基于卷积神经网络(CNN)的方法通常通过输出人群密度将人群计数作为回归任务。他们学习图像内容和人群密度分布之间的映射。尽管取得了令人鼓舞的结果,但这些数据驱动的计数网络易于高估或低估具有不同密度模式的区域的人数,这会降低整体计数的准确性。为了克服这个问题,我们提出了一种减轻不同区域的计数性能差异的方法。具体来说,我们的方法由两个网络组成,分别称为密度注意力网络(DANet)和注意力尺度网络(ASNet)。 DANet为ASNet提供与不同密度级别的区域有关的注意力masks。 ASNet首先生成密度图和尺度因子,然后将它们乘以注意力masks,以输出单独的基于注意力的密度图。将这些密度图相加得出最终的密度图。注意力尺度例因子有助于减弱不同区域中的估计误差。此