两个面向视觉定位的遥感船舶数据集：RSSVG&SARVG

原创于 2025-04-23 15:13:45 发布 · 441 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#计算机视觉

WUTCM-Lab数据集专栏收录该内容

2 篇文章

订阅专栏

遥感船舶图像视觉定位（VGRSS）任务

VGRSS的目标是通过自然语言指导在遥感图像中定位船舶目标。针对该任务，WUTCM实验室建立了两个数据集：RSSVG和SARVG。

RSSVG Dataset

RSSVG数据集基于光学遥感影像，包含25,237对光学遥感图像-文本查询及11,157张图像，平均描述长度9.77词（最长17词）。语言表达呈现多维度特征，高频词汇"货轮"凸显船舶类型标注，同时涵盖尺寸（大/中/小）、颜色（白/蓝）、方位（左/右）及工程属性（甲板/引擎），完整刻画船舶外观与场景语义，适用于复杂光学影像的细粒度视觉定位。

SARVG Dataset

SARVG数据集基于合成孔径雷达（SAR）影像，包含54,429对SAR图像-文本查询及43,798张图像，平均描述长度7.72词（最长19词）。语言特征聚焦空间关系与尺寸对比，高频词"大型船舶"“中尺寸"配合方位词"左上”"右下"形成核心描述范式，契合SAR图像低纹理、高几何特性的解析需求，强化了船舶位置感知与相对尺度判读能力。

相关模型：

VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images | IEEE Journals & Magazine | IEEE Xplore

Y. Chen, L. Zhan, Y. Zhao, S. Xiong and X. Lu, "VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images," in IEEE Transactions on Geoscience and Remote Sensing, doi: 10.1109/TGRS.2025.3562717.

致谢：

RSSVG 数据集源自 FAIR1M、CGWX 和 DIOR-RSVG 数据集的船舶部分，而 SARVG 数据集源自 SAR-Ship-Dataset。我们感谢这些数据集的作者提供他们的数据，这极大地促进了我们的研究。我们的部分代码基于 TransVG，我们感谢各个作者的宝贵贡献。我们还感谢武汉理工大学计算机与人工智能学院对这项研究的支持。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。