代码地址
https://github.com/akhilpm/dronedetectron2
摘要
密集裁剪是一种广泛使用的方法来改进这种小物体检测,其中以高分辨率提取和处理拥挤的小物体区域。然而,这通常是通过添加其他可学习的组件来实现的,从而使标准检测过程中的训练和推理变得复杂。本文中,我们提出了一种高效的级联放大(CZ
)检测器,该检测器将检测器本身重新用于密度引导的训练和推理。在训练过程中,密度裁剪物被定位,标记为一个新的类,并用于增强训练数据集。在推理过程中,密度裁剪物首先与基类对象一起被检测,然后被输入用于第二阶段的推理。这种方法很容易集成到任何检测器中,并且不会对标准检测过程产生显著变化,就像航空图像检测中流行的均匀裁剪方法一样。
总结
密集裁剪可以用来改进小物体检测,但是这通常是通过添加其他可学习的组件来实现的。但是,我们提
出了一种高效的级联放大(
CZ
)检测器,该检测器将检测器本身重新用于密度引导的训练和推理。
1、介绍
航空图像是高分辨率拍摄的,这些物体稀疏地分布在拥挤的物体区域,通常由许多小物体组成。高分辨率图像和微小物体给航空图像中的物体检测带来了一些挑战,包括由于重新缩放和特征下采样导致的信息丢失、对边界框偏移的低容忍度以及噪声特征表示[5
,
8]
等。由于计算成本和大的内存占用,很难将高分辨率航空图像直接输入到检测器,因此通常会将其调整为标准分辨率范围(见图第2
(
a
)段)。

(a)
将图像缩放到探测器的尺寸下
。这种重新缩放,再加上
ConvNetx
中的特征下采样,通常会导致与小对象相关的特征表示因噪声背景激活而减少或损坏。关于边界框偏移的容差,边界框中的小偏移可能会导致并集上的交集(IoU
)大幅下降,从而增加假阳性检测
[5]
。(
但是这种缩放不好,会导致小对象的
特征丢失
)
为了利用更高的分辨率,并减轻信息损失,一种流行的方法是将输入图像裁剪成均匀的补丁,然后通过上采样对这些补丁进行高分辨率的对象检测(见图2
(
b
))(
b)
图像被分割成均匀、可能重叠的补丁,
每个补丁都有检测器处理
。

尽管这些均匀的补丁有助于提高精度,但
这种方法不考虑图像中对象的分布,因此实现的尺度归一化不
是最佳的
[17
,
37]
。由于航空图像中的物体通常出现在图像稀疏分布的区域中,因此需要执行基于密度的裁剪,然后处理这些拥挤物体区域的高分辨率版本以获得更好的比例平衡。
为了提取这些密度裁剪,现有的方法利用了额外的可学习模块(见图
2
(
c
)),(
c)
外部可学习模块将
图像裁剪成密集的对象区域(也就是说只裁剪图像中的密集区域)
。
每种裁剪都会按照探测器的分辨率
重新缩放和处理
。

如密度图
[17]
、聚类建议网络
[37]
、全局局部检测管道