两个面向视觉定位的遥感船舶数据集:RSSVG&SARVG

遥感船舶图像视觉定位(VGRSS)任务

​VGRSS的目标是通过自然语言指导在遥感图像中定位船舶目标。针对该任务,WUTCM实验室建立了两个数据集:RSSVG和SARVG。

RSSVG Dataset

RSSVG数据集基于光学遥感影像,包含25,237对光学遥感图像-文本查询及11,157张图像,平均描述长度9.77词(最长17词)。语言表达呈现多维度特征,高频词汇"货轮"凸显船舶类型标注,同时涵盖尺寸(大/中/小)、颜色(白/蓝)、方位(左/右)及工程属性(甲板/引擎),完整刻画船舶外观与场景语义,适用于复杂光学影像的细粒度视觉定位。

SARVG Dataset

SARVG数据集基于合成孔径雷达(SAR)影像,包含54,429对SAR图像-文本查询及43,798张图像,平均描述长度7.72词(最长19词)。语言特征聚焦空间关系与尺寸对比,高频词"大型船舶"“中尺寸"配合方位词"左上”"右下"形成核心描述范式,契合SAR图像低纹理、高几何特性的解析需求,强化了船舶位置感知与相对尺度判读能力。

相关模型:

VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images | IEEE Journals & Magazine | IEEE Xplore

 

Y. Chen, L. Zhan, Y. Zhao, S. Xiong and X. Lu, "VGRSS: Datasets and Models for Visual Grounding in Remote Sensing Ship Images," in IEEE Transactions on Geoscience and Remote Sensing, doi: 10.1109/TGRS.2025.3562717.

致谢:

RSSVG 数据集源自 FAIR1M、CGWX 和 DIOR-RSVG 数据集的船舶部分,而 SARVG 数据集源自 SAR-Ship-Dataset。我们感谢这些数据集的作者提供他们的数据,这极大地促进了我们的研究。我们的部分代码基于 TransVG,我们感谢各个作者的宝贵贡献。我们还感谢武汉理工大学计算机与人工智能学院对这项研究的支持。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值