遥感大模型也称为遥感预训练基础模型,是一种利用大量的未标注遥感图像来训练大规模深度学习模型的方法,目的是提取遥感图像中的通用特征表示,进而提高遥感图像分析任务的性能、效率和通用性。遥感大模型能够实现对地球表面信息的全面、快速提取,为环境监测、城市规划、资源调查等领域提供有力支持。
遥感大模型的成功离不开高质量的遥感数据集,这些数据集通常包括卫星遥感、航空遥感、地面遥感等。随着遥感技术的不断进步,数据获取的成本逐渐降低,数据量呈指数级增长。数据处理方面,遥感大模型需要处理的数据类型多样,包括光学遥感数据、雷达遥感数据、高光谱遥感数据等。笔者精心整理了近年来,国内外知名机构发布的高质量遥感数据集,便于大家学习和使用。整理工作将持续进行中。
MMEarth - 遥感多模态预训练数据集
- 发布时间:2024-07-29
- 发布机构:哥本哈根大学
- 地址:数据集地址
- 数据集说明:MMEarth 是哥本哈根大学构建的一个全球范围的多模态预训练数据集,覆盖了120万个地理位置,包含12种不同的模态数据。MMEarth利用地理位置和时间自动对齐不同传感器的数据,几乎无需人工干预。MMEarth的设计目标是用于全球范围内的环境监测和遥感任务。
MagicBathyNet - 多模态遥感基准数据集
- 发布时间:2024-05-24
- 发布机构:柏林工业大学等
- 地址:数据集地址
- 数据集说明:该数据集整合了Sentinel-2、SPOT-6卫星图像及航空影像的图像块,同时涵盖栅格格式的水深信息与海底类型注释,专为浅水区域的水深预测与像素级分类研究设计。MagicBathyNet数据集覆盖了两个截然不同的沿海区域:塞浦路斯的Agia Napa地区和波兰的Puck Lagoon地区,这些区域在水体特征和海底类型上有很大的差异。数据集包含3355组Sentinel-2、SPOT-6及航空影像的RGB共注册三元组,辅以1244组双影像对,3354幅航空影像对应的DSM(数字表面模型)栅格图块,以及3396幅Sentinel-2与SPOT-6对应的DSM图像块。此外,还包括533幅用于监督式像素分类的海底生境标注图块,每块图像对应180x180米实地范围,分别以18x18、30x30、720x720像素分辨率呈现于不同来源影像中。MagicBathyNet数据集旨在促进浅水区环境的精细解析,为海洋地质学、生态监测及水下地形建模提供了宝贵的资源。
MMRS - 多模态遥感指令跟随数据集
- 发布时间:2024-03-08
- 发布机构:北京理工大学
- 地址:数据集地址
- 数据集说明:MMRS数据集,包含了100万多个图像-文本对,涵盖了分类、检测、图像描述、VQA、视觉定位等多个任务,并包括光学、红外和SAR三种视觉模态。该数据集旨在促进遥感领域中MLLMs的持续发展。
S2-NAIP 美国超分遥感数据集
- 发布时间:2024-03-06
- 发布机构:艾伦人工智能研究所
- 地址:数据集地址
- 数据集说明:S2-NAIP是艾伦人工智能研究所发布的一个超分辨率遥感数据集,包含了美国大陆地区的 NAIP 和 Sentinel-2 成对影像。该数据集以512x512像素的瓦片形式组织,像素分辨率为1.25 米/像素,采用UTM投影,每个瓦片综合了包括NAIP、Sentinel-2、Sentinel-1、Landsat、OpenStreetMap和 WorldCover在内的多源数据。数据集解压后不同类型的数据存放在不同的文件夹中,每个文件夹包含以瓦片 ID 命名的文件,该 ID 由 UTM 投影、列和行组成。NAIP-S2数据集在遥感科学领域具有广泛应用,特别是在地表监测、资源管理和环境变化评估等方面,提供了高精度的数据支持。
LHRS-Align / LHRS-Instruct
- 发布时间:2024-02-04
- 发布机构:南京大学
- 地址:数据集地址
- 数据集说明:LHRS-Align,一个大规模、语义丰富且特征多样的遥感图像-文本对齐数据集。利用了OpenStreetMap的志愿地理信息VGI和Google Earth的遥感图像,数据集包含115万高质量的RS图像-文本对。LHRS-Instruct 为遥感领域的多模态指令跟随设计,重新组织了一系列开源遥感数据集为多任务指令数据集,并使用GPT-4生成复杂的指令数据。
SkyEye-968k
- 发布时间:2024-01-18
- 发布机构:西北工业大学
- 地址:数据集地址
- 数据集说明:SkyEye-968k数据集包含了968k个单任务图像-文本指令和多任务会话指令样本,其中包括对公共数据的重新组织和一些经过手工验证的生成数据。该数据集填补了大规模遥感多模态指令跟随数据的空白。
RS5M 大规模图文配对遥感数据集
- 发布时间:2024-01-02
- 发布机构:浙江大学
- 地址:数据集地址
- 数据集说明:RS5M 数据集包含 500 万张带有英文描述的遥感图像。该数据集是通过使用预训练的 VLM 筛选公开可用的图像文本配对数据集和带标签的 RS 数据集而获得的。这些构成了第一个大规模 RS 图像文本配对数据集。
SkyScript
- 发布时间:2023-12-20
- 发布机构:斯坦福大学
- 地址:数据集地址
- 数据集说明:SkyScript是由斯坦福大学创建的一个大规模且语义多样的遥感视觉语言数据集,包含260万个图像-文本对,覆盖2.9万个不同的语义标签。该数据集通过地理坐标将Google Earth Engine上的无标签遥感图像与OpenStreetMap中的丰富语义信息相连接,实现了全球覆盖。SkyScript不仅包含广泛的对象类别,还包含子类别和详细属性,如农田作物类型、道路表面材料等。该数据集旨在支持遥感领域中多种多模态任务的发展,如开放词汇分类、检索、图像描述和文本到图像合成。

GeoChat Instruct 遥感多模态指令跟踪数据集
- 发布时间:2023-11-24
- 发布机构:穆罕默德·本·扎耶德人工智能大学等
- 地址:数据集地址
- 数据集说明:GeoChat Instruct 数据集是一个为遥感领域设计的多模态指令跟踪数据集,该数据集利用了 Vicuna-v1.5 和自动化管道来生成,包含近 318k 条指令,旨在扩展多模态指令调整到遥感领域,以训练多任务会话助理。 GeoChat_Instruct 数据集的创建是为了解决遥感领域缺乏多模态指令调整对话数据集的问题,并用于微调名为 GeoChat 的遥感领域视觉语言模型。
RSICap
- 发布时间:2023-07-28
- 发布机构:阿里巴巴达摩院等
- 地址:数据集地址
- 数据集说明:RSICap是一个专为遥感领域设计的高质量图像描述数据集。该数据集包含2585个人工标注的图像描述,每个描述都提供了丰富的场景和物体信息,如颜色、形状、位置和数量等。RSICap不仅描述了图像的主要场景,还详细描述了物体之间的关系和视觉推理知识。此外,数据集还包括一个评估集RSIEval,用于评估视觉语言模型在遥感图像描述和视觉问答任务上的表现。RSICap和RSIEval的创建旨在推动遥感领域大型视觉语言模型的发展,解决现有数据集在规模和质量上的不足。
Earth Parser Dataset 遥感测绘数据集
- 发布时间:2023-04-19
- 发布机构:古斯塔夫·埃菲尔大学等
- 地址:数据集地址
- 数据集说明:该数据集是一种用于训练和评估大型、未经整理的航空激光雷达扫描解析方法的新数据集,用于训练和评估大型、未经整理的空中 LiDAR 扫描的解析方法。研究团队使用与 LiDAR-HD 项目相关的法国测绘局的数据。该数据集包含 7 个场景,覆盖面积超过 7.7 平方公里,总共 9,800 万个 3D 点,内容和复杂程度各异,例如密集的居住区、森林或复杂的工业设施。
Million-AID
- 发布时间:2021-03-30
- 发布机构:武汉大学等
- 地址:数据集地址
- 数据集说明:Million-AID是一个包含百万实例的用于遥感场景分类的大型基准数据集。其包含了广泛的语义类别,即51个场景类别,由三级树的分级类别网络组织而成:51个叶节点分为第二层的28个父节点,父节点又分组为第一级的8个节点,分别代表农业用地、商业用地、工业用地、公共服务用地、居住用地、交通用地、未利用地和水域8个底层场景类别。场景类别网络为数据集提供了良好的不同场景类别之间的关系组织和可扩展性。每个场景类别的图像数量大约在2000到45000之间,这使得数据集具有长尾分布的特性。此外,Million-AID具有空间分辨率高、规模大、分布全球等优势,优于现有的场景分类数据集。
EuroSAT 遥感图像数据集
- 发布时间:2019-02-01
- 发布机构:德国凯泽斯劳滕工业大学、德国人工智能研究中心 (DFKI)
- 地址:数据集地址
- 数据集说明:Eurosat 是一个用于土地利用、土地覆盖分类的数据集及深度学习基准。该数据集基于 Sentinel-2 卫星图像,涵盖 13 个光谱波段,由 10 个类别组成,共有 27,000 张有标注和地理参照的图像。每一种场景类别包含 2,000~3,000 张遥感图像,每张图像尺寸大小为 64 × 64 像素。
929

被折叠的 条评论
为什么被折叠?



