赛事推荐|遥感目标检测最新比赛（20230221-20230427）

最新推荐文章于 2025-05-07 09:16:30 发布

遥感深度学习

最新推荐文章于 2025-05-07 09:16:30 发布

阅读量1.6k

点赞数 1

分类专栏：赛事推荐算法推荐文章标签：目标检测计算机视觉人工智能遥感比赛

本文链接：https://blog.youkuaiyun.com/weixin_38517705/article/details/129904265

版权

赛事推荐同时被 2 个专栏收录

5 篇文章

订阅专栏

算法推荐

2 篇文章

订阅专栏

文章介绍了MAFAT卫星视觉挑战赛，该比赛聚焦于从卫星图像中检测旋转目标，涉及多种图像条件和目标类别。比赛数据集包括带标注和无标注图像，具有多样化的场景和目标，对参赛者的模型泛化能力有高要求。比赛分为公开和私人阶段，奖金丰厚，并在CodaLab平台上以代码提交形式进行，对推理代码有特定的运行时间和资源限制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

赛事推荐|遥感目标检测最新比赛（20230221-20230427）

1. 赛题名称

MAFAT 卫星视觉挑战赛（旋转目标检测类）

2. 赛题背景

在这一挑战中，MAFAT 的 DDR&D（国防研究与发展局）希望解决从卫星图像检测物体的挑战。参与者的目标是从多样化的卫星图像中检测某些类别的物体。比赛数据集中可用的图像分辨率、向下角度（俯仰）、方向（方位角）以及拍摄日期和时间（一天中的时间和季节性）而异。这一挑战遵循 xVIEW、SpaceNet 和 DOTA 的传统，将计算机视觉应用于从太空拍摄的数量迅速增加的图像，以便更深入地了解视觉世界并满足各种重要需求。

在这里插入图片描述

3. 数据分析

3.1 带标注的数据集

标记的训练集包含超过 18,000 个定向边界框，跨越 13 个类别，超过 1400 帧，每帧包含 1280*1280 灰度像素。专业的注释者绘制了方框以确保准确性和一致性。帧是多种多样的，通常包含具有多个对象的复杂场景。但是，请注意，帧可能根本不包含任何对象。

3.2 无标注数据集

未标记的训练集包含 8,000 多个帧，其中添加了元数据文件但没有注释数据。

3.3 场景及目标多样

该数据集包含在一天中的不同日期和时间在各种土地类型（城市、农村、工业区、海洋等）中捕获的图像。图像在覆盖土地面积的大小、天气条件、摄影角度、照明条件和分辨率方面也有所不同。以下示例很好地说明了竞赛数据集的多样性：

图像分辨率在 0.4m 到 1.3m GSD（地面采样距离）之间变化。因此，同一对象的像素大小在不同的图像中会有所不同。
对象有各种大小，从非常大（例如大型容器）到很小（例如小型车辆）。

在这里插入图片描述

相同感兴趣区域的最低点和偏离最低点（倾斜）图像的变化。
在某些图像中，存在包含小而密集的物体的密集场景，而在其他图像中，存在稀疏且无人居住的场景。

在这里插入图片描述

3.4 数据集结构

主要数据集（带标签的训练集、公共测试集和私有测试集）包含 3 个数据文件：图像、标签和元数据。带标签的训练数据集包含 1,457 帧，作为 zip 存档占用大约 3.3 GB 的磁盘空间，未压缩时占用 3.4 GB。

3.5 文件说明

图像：所有具有唯一名称的图像文件，16 位灰度，tiff 格式。
标签：对于每个图像，都有一个带有注释的匹配文本文件。每条线代表一个对象。下面是一个对象的格式注释：x1, y1, x2, y2, x3, y3, x4, y4, class_name。
元数据：包含以下数据的元数据文件：‘Frame’：每个帧的唯一名称。‘AOI’：拍摄图像的感兴趣区域。‘分辨率’：帧的分辨率（以每像素厘米为单位描述的地面采样距离）。‘Sun_elevation’：太阳的天顶角（度）。‘Azimuth’：卫星的水平角（度）。‘Sun_azimuth’：太阳位置（度）的水平角（相对于北方）‘Hermetic_Small_Vehicle’：如果类“small_vehicle”在此特定框架中被密封标记，则为真/假。

4. 赛题分析

**旋转目标！！！**与水平边界框 (HBB) 的常见注释不同，对象被注释为旋转边界框 (OBB)。这样做是为了更好地检测任意方向的物体，但是，这种方法可能与当前的大多数物体检测深度神经网络模型不兼容，不能开箱即用。
**多种视角的影像！！！**数据集包括垂直（最低点）和倾斜（偏离最低点）图像。虽然正射卫星图像中的目标检测被广泛研究，但倾斜卫星图像中的目标检测研究较少。将两种类型的图像组合在同一数据集中提出了更大的挑战，因为每个对象类的视觉外观可能差异很大。
**小目标！！！**数据集包含类之间和类内各种像素大小的对象，一些对象非常大（例如大容器），而另一些对象很小（例如小型车辆）。此外，由于数据集中的分辨率不同，同一对象可能出现在截然不同的像素区域。例如，小型车辆对象的像素区域可以在 8（！）像素到大约 50-60 像素之间变化。 ****
**复杂场景！！！**数据集中的一些对象在外观上看起来相似，但只能通过它们的上下文来区分（例如容器和公共汽车）。
**自监督或者半监督！！！**无限可能——除了标准的标记训练集外，我们还提供未标记的训练集，让参赛者有机会在他们的方法中采用无监督或半监督方法。此外，允许参赛者对测试数据进行两次传递，一次用于校准，另一次用于预测。

总之，对模型的泛化性要求较高，最好能适应域变化的一些场景。

在这里插入图片描述