RDNet

RDNet结合density map和depth信息,通过RetinaNet改进crowd counting和localization,利用深度信息辅助检测,提高小目标检测精度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

RDNet:Density Map Regression Guided Detection Network for RGB-D Crowd Counting and Localization

Introduction

Motivation:Regression-based方法有局限性,希望还是使用detection-based可以估计出每个人头的位置信息。直接使用RGB,由于有些实在太小,进行detection很容易发生underestimation。所以,希望通过RGBD,以depth信息辅助进行detect(人头的远近与检测框的大小是直接相关的,depth信息帮助预测检测框size)。

Idea:

  1. 基于denseity map,添加分支,进行detect
  2. Depth-adaptive kernel。使用depth信息得到the size of adaptive kernel,生成gt
  3. Use RetinaNet and leverage depth for anchor sizes initialization

另外,bbox的标注十分麻烦,作者制作的RGBD数据集只标注了points,bbox则是依据depth of the head center生成的,并用于train and test

Method

在这里插入图片描述
分为regression module&detection module

regression module就是使用CSRNet,以及gt换成depth-based kernel生成。得到的density map替代普通RetinaNet CNN部分得到的feature,density map非常精细,很适合用来检测tiny targets。
另外,在depth信息与CNN feature的直接融合上,本文是利用depth制作了5个mask,然后与density feature直接相乘,得到五个不同尺度(不同深度目标)的feature,然后送去detect

detection module主要是retinaNet,以及anchor用到了depth先验信息来估计大小。

Experiments

RDNet主要是用来做detection,对比CSRNet结果,没有利用depth信息提升MAE,我可以在这方面做文章:
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值