Density Map Guided Object Detection in Aerial Images 论文阅读笔记
出处:CVPR2020
一、介绍
文章主要研究的是基于高分辨率航拍图像的目标检测,其难点有二:1)目标尺度变化较大; 2) 目标的数量和类别分布不均匀;3)目标遮挡和截断;4)小目标占比多。
比较通用的方法是将图像进行规则的裁剪,然后对每一块裁剪区域分别进行目标检测。这种方法能够提高小目标的检测精度,因为当小物体的大小被调整到原始图像的大小时,它们的分辨率会变得更高。然而这些方法并不能平衡裁剪所导致的语义信息的丢失,除此之外,大的物体也可能会被裁剪成多份。
所以,文章重点关注图像的裁剪策略来解决这一问题,并提出了一种基于密度图指导的目标检测网络——DMNet,其包含三个主要的模块:
- 密度图生成模块
- 图像裁剪模块
- 目标检测模块
启发于密度图中显示了物体是如何根据图的像素强度进行分布的。随着像素强度的变化,它能够判断一个区域是否有物体,根据密度强度学习尺度信息,最终形成裁剪区域。
二、相关工作
2.1 通用目标检测
基于提议的检测器引入了多级锚框的概念。Fast R-CNN通过选择性搜索生成提议,然后根据这些提议提取特征并对对象进行分类。Faster R-CNN通过区域提议建议网络(RPN)生成建议框,显著提高推理速度。Mask R-CNN扩展了Faster R-CNN,同时执行检测和实例分割任务。
另一方面,