ICCV2019-DSSINet: Crowd Counting with Deep Structured Scale Integration Network


师兄ICCV的论文哈哈。有人问到了模型效率问题,参数量还可以,但是flop很多,速度比较慢。实验室的另一个工作讨论了crowd counting的一些模型的运行效率:
Efficient Crowd Counting via Structured Knowledge Transfer

DSSINet overview

模型非常清晰,三个不同分辨率的图片经过三个网络支干,不断进行卷积&下采样,融合不同支干网络的特征,并小特征不断进行上采样再与之前的特征融合(类似FPN的模型流程)。
图一
三条网络,最后一层都是VGG中的Conv4_3
在这里插入图片描述
本文主要贡献在:

  1. 特征的融合方式上,不是简单的加权叠加或者通道拼在一起。
    使用了基于CRFs的Structured Feature Enhancement Module(图中的SFEM)
    在这里插入图片描述
  2. 一种在不同尺寸下,对局部区域输出高质量density maps的loss计算方式—— a Dilated Mul-tiscale Structural Similarity loss
    在这里插入图片描述

模块分析

论文中3.1节overview中表述了SFEM模块的作用,
在这里插入图片描述
下面具体介绍

SFEM

SFEM在不同scale,refine the features,并与CRFs model具有互补性
在这里插入图片描述

用CRFs model将特征refine:
在这里插入图片描述
然后这是特征融合方式???
在这里插入图片描述
就是这样稍微数学一点的融合方式??
在这里插入图片描述
反正最后,得到了这样的一个迭代公式(7):
在这里插入图片描述
f i f_i

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值