遥感影像-语义分割数据集:WHDLD数据集详细介绍及训练样本处理流程

原始数据集详情

简介:WHDLD是一个密集的标签数据集,可用于多标签任务,例如遥感图像检索(RSIR)和分类,以及其他基于像素的任务,例如语义分割(在遥感中也称为分类)。

KeyValue
卫星类型GaoFen-1、ZiYuan-3
覆盖区域未知
场景未知
分辨率2m
数量4940张
单张尺寸256*256
原始影像位深8位
标签图片位深8位
原始影像通道数三通道
标签图片通道数单通道

标签类别对照表

像素值类别名(英文)类别名(中文)RGB
1building建筑物255、0、0
2road道路255、255、0
3pavement人行道192、192、0
4vegetation植被0、255、0
5bare soil裸土128、128、128
6water水体0、0、255

数据处理部分

大家是否有这样的困惑,真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:

在这里插入图片描述

下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:

在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示

/path/to/datas
├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

获取相关数据集或咨询交流见 博主首页 个人简介
1、官网原始数据集;
2、中间处理好的大图数据集;
3、裁剪后可直接训练的小图数据集;

### SegFormer在WHDL环境下的配置及训练 #### 一、理解WHDL环境 WHDL(Windows硬件开发实验室)通常指代一种特定于Windows系统的开发测试平台,用于加速基于Windows的应用程序和模型的开发流程。然而,“whdld”可能是指具体的某个项目或自定义命名空间内的特殊设定,在常规公开资料中并不常见此表述方式。 对于SegFormer而言,如果目标是在类似于WHDL这样的定制化Windows环境中部署,则需特别注意操作系统兼容性和依赖项管理[^2]。 #### 二、准备Python与PyTorch环境 考虑到SegFormer对CUDA的支持以及MMCV-full库的要求,在开始之前应确保已正确设置了适合当前GPU架构版本的PyTorch环境。这一步骤至关重要,因为后续所有操作都将在此基础上展开。建议依据官方文档指导完成相应设置,并验证安装无误后继续下一步。 ```bash conda create -n segformer python=3.8 -y conda activate segformer pip install torch torchvision torchaudio cudatoolkit=<对应版本> -f https://download.pytorch.org/whl/torch_stable.html ``` #### 三、安装必要的软件包 进入`segformer-master`根目录执行以下命令以安装所需的第三方库: ```bash cd segformer-master pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple pip install -e . --user ``` 上述指令不仅能够简化依赖关系处理过程,还能有效规避因网络原因造成的下载失败等问题[^4]。 #### 四、调整数据集适配 针对ADE20K以外的数据源如WBC或其他医学影像集合时,除了修改路径外还需要编辑位于`mmseg/core/evaluation/class_names.py`中的类别名称列表及其对应的调色板信息,使其匹配实际使用的标签体系[^3]。 #### 五、启动训练脚本前最后确认事项 - **检查设备状态**:通过`nvidia-smi`查看是否有足够的显存可用; - **核实现有参数配置文件**:特别是那些涉及输入尺寸、批量大小等方面的内容; - **备份原始代码仓库**:以防万一可以在出现问题时快速恢复至初始状态; 一旦以上准备工作全部就绪即可按照正常流程发起训练任务了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值