RDNet

最新推荐文章于 2024-09-07 09:06:56 发布

原创最新推荐文章于 2024-09-07 09:06:56 发布 · 1.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

crowd counting 同时被 2 个专栏收录

5 篇文章

订阅专栏

Multimodal Learning

4 篇文章

订阅专栏

RDNet结合density map和depth信息，通过RetinaNet改进crowd counting和localization，利用深度信息辅助检测，提高小目标检测精度。

RDNet：Density Map Regression Guided Detection Network for RGB-D Crowd Counting and Localization

Introduction
Method
Experiments

Introduction

Motivation：Regression-based方法有局限性，希望还是使用detection-based可以估计出每个人头的位置信息。直接使用RGB，由于有些实在太小，进行detection很容易发生underestimation。所以，希望通过RGBD，以depth信息辅助进行detect（人头的远近与检测框的大小是直接相关的，depth信息帮助预测检测框size）。

Idea：

基于denseity map，添加分支，进行detect
Depth-adaptive kernel。使用depth信息得到the size of adaptive kernel，生成gt
Use RetinaNet and leverage depth for anchor sizes initialization

另外，bbox的标注十分麻烦，作者制作的RGBD数据集只标注了points，bbox则是依据depth of the head center生成的，并用于train and test

Method

在这里插入图片描述
分为regression module&detection module

regression module就是使用CSRNet，以及gt换成depth-based kernel生成。得到的density map替代普通RetinaNet CNN部分得到的feature，density map非常精细，很适合用来检测tiny targets。
另外，在depth信息与CNN feature的直接融合上，本文是利用depth制作了5个mask，然后与density feature直接相乘，得到五个不同尺度(不同深度目标)的feature，然后送去detect

detection module主要是retinaNet，以及anchor用到了depth先验信息来估计大小。

Experiments

RDNet主要是用来做detection，对比CSRNet结果，没有利用depth信息提升MAE，我可以在这方面做文章：
在这里插入图片描述

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。