原文链接:https://www.mdpi.com/2072-4292/15/2/371#
基于深度学习(DL)的目标检测算法在自然图像方面取得了令人瞩目的成就,并近年来逐渐成熟。 然而,与自然图像相比,遥感图像由于背景复杂、密集场景中的小物体检测困难,面临着严峻的挑战。 为了解决这些问题,基于多内核扩张卷积(MDC)块和变换器块,提出了一种名为 MDCT 的新型单阶段目标检测模型。 首先,在一阶段目标检测模型中开发了一种新的特征增强模块MDC块,以增强小目标的本体和相邻空间特征。 其次,我们将变压器块集成到一级目标检测模型的颈部网络中,以防止复杂背景和密集场景中目标信息的丢失。 最后,在每个MDC块中引入深度可分离卷积以降低计算成本。 我们在三个数据集上进行实验:DIOR、DOTA 和 NWPU VHR-10。 与YOLOv5相比,我们的模型在DIOR、DOTA和NWPU VHR-10数据集上的目标检测精度分别提高了2.3%、0.9%和2.9%。
随着传感器制造技术的进步,许多专业级遥感卫星定期发射,使我们能够收集到大量的遥感数据。 遥感图像(RSIs)具有图像覆盖面广、拍摄距离远的特点[1]。 虽然 RSI 传达了各种对物体检测有用的特征和信息,但它们也提供了大量冗余数据,使得找到小物体变得更加困难。 此外,物体的形状和角度是可变的,使得分析和处理长距离RSI变得更加困难。 然而,与自然图像相比,RSI 由于其独特的性质,在目标检测方面面临许多挑战[2]。
RSI 通常包含许多小尺寸物体,这些物体在图像中占据较少的像素。 由于卷积神经网络中逐层进行特征提取,一些中小尺寸的物体很难维持在最高层的特征图中。 结果,模型无法收集足够的物体特征信息,因此在检测过程中很容易忽略
Object Detection of Remote Sensing Images
于 2024-04-17 20:40:21 首次发布