卫星影像超分辨率重建数据集:gh_mirrors/te/techniques数据采集方法

卫星影像超分辨率重建数据集:gh_mirrors/te/techniques数据采集方法

【免费下载链接】techniques Techniques for deep learning with satellite & aerial imagery 【免费下载链接】techniques 项目地址: https://gitcode.com/gh_mirrors/te/techniques

你是否还在为卫星影像分析中低分辨率数据影响模型精度而困扰?是否需要一套标准化的数据采集方案来构建高质量超分辨率重建数据集?本文将通过gh_mirrors/te/techniques项目的实践经验,带你掌握从多源影像获取到质量评估的全流程数据采集方法,30分钟即可启动自己的超分辨率项目。读完本文你将获得:

  • 4种核心数据源的获取方案
  • 6步数据预处理标准化流程
  • 质量评估与数据集划分指南

数据采集核心流程概览

卫星影像超分辨率重建数据集的构建需要兼顾数据多样性、标注精度和场景代表性。项目基于GitHub 加速计划 / te / techniques构建的标准化流程包含四个阶段:

mermaid

数据源对比与选择策略

数据源空间分辨率光谱范围获取难度适用场景项目案例
Sentinel-210-60m13波段低(免费)大范围监测Classification
Landsat-815-30m11波段低(免费)时序分析Time series
WorldView-30.3m8波段高(付费)精细特征提取Segmentation
无人机航拍0.05-0.5mRGB+近红外中(自建)局部精细建模Object detection

多源数据获取实战

1. 免费卫星影像获取

Sentinel-2数据可通过欧空局哥白尼开放访问中心获取,项目提供的API可简化批量下载流程:

from satellite_dl import DataDownloader

# 初始化下载器
downloader = DataDownloader(source="sentinel2")

# 定义感兴趣区域(ROI)
roi = {
    "min_lon": 116.2,
    "max_lon": 116.4,
    "min_lat": 39.8,
    "max_lat": 40.0
}

# 批量下载2023年无云影像
downloader.batch_download(
    roi=roi,
    start_date="2023-06-01",
    end_date="2023-09-30",
    cloud_cover_threshold=10,  # 云量小于10%
    output_dir="./data/sentinel2"
)

2. 高分辨率数据增强方案

对于缺乏高分辨率影像的场景,可使用项目中的生成模型API进行超分辨率重建:

from satellite_dl import GenerativeAPI

# 初始化生成模型API
gan_api = GenerativeAPI(model_type="GAN", task="super_resolution")

# 将15m分辨率Landsat影像提升至1m
super_res_image = gan_api.gan_super_resolve(
    input_image="data/landsat/image.tif",
    scale_factor=15,  # 15倍超分
    enhance_detail=True
)

# 保存结果
super_res_image.save("data/enhanced/image_sr.tif")


超分辨率效果对比:左为原始15m Landsat影像,右为1m超分结果

数据预处理标准化流程

1. 辐射校正与大气校正

原始卫星影像需要经过辐射校正消除传感器误差,项目提供的预处理API可自动化这一流程:

from satellite_dl import ImagePreprocessor

processor = ImagePreprocessor()

# 对Sentinel-2影像进行大气校正
corrected_image = processor.atmospheric_correction(
    input_path="data/sentinel2/raw/S2A_MSIL1C_20230615T022051_N0509_R092_T50SMB_20230615T050825.SAFE",
    output_path="data/sentinel2/corrected/image_corr.tif",
    method="sen2cor"  # 使用欧空局官方校正算法
)

2. 影像配准与融合

多源影像需要进行空间配准以确保像素级对齐,项目的融合API支持多种融合算法:

# 全色影像与多光谱影像融合
pansharpened_image = processor.pansharpen(
    pan_image="data/wv3/pan.tif",  # 全色波段(0.3m)
    ms_image="data/wv3/ms.tif",    # 多光谱影像(1.2m)
    method="brovey"                # Brovey变换融合算法
)

pansharpened_image.save("data/fused/image_fused.tif")


全色锐化效果:左为原始多光谱影像,右为融合后高分辨率影像

数据集质量评估体系

1. 空间分辨率验证

使用半参考评估方法验证超分辨率效果:

from satellite_dl import QualityAssessor

assessor = QualityAssessor()

# 计算超分辨率影像的空间细节指标
metrics = assessor.evaluate_sr_quality(
    sr_image="data/enhanced/image_sr.tif",
    hr_ground_truth="data/wv3/ground_truth.tif"
)

print(f"PSNR: {metrics['psnr']:.2f} dB")
print(f"SSIM: {metrics['ssim']:.4f}")
print(f"RMSE: {metrics['rmse']:.4f}")

2. 典型质量问题解决方案

问题类型检测方法解决策略对应工具
云覆盖阈值法(NDCI指数)云移除APIcloud_remove()
运动模糊边缘梯度检测去模糊增强gan_super_resolve()
光谱畸变光谱角匹配辐射归一化radiometric_normalize()

数据集划分与增强

1. 科学划分策略

合理的数据集划分是模型泛化能力的关键,项目提供自动化划分工具:

from satellite_dl import DatasetSplitter

splitter = DatasetSplitter()

# 按空间分布划分(避免数据泄露)
splitter.spatial_split(
    image_dir="data/processed/images/",
    label_dir="data/processed/labels/",
    output_dir="data/split/",
    train_ratio=0.7,
    val_ratio=0.2,
    test_ratio=0.1,
    tile_size=512  # 512x512像素瓦片
)

2. 数据增强方案

针对超分辨率重建任务的特定增强策略:

from satellite_dl import DataAugmenter

augmenter = DataAugmenter()

# 生成增强样本
augmented_samples = augmenter.generate(
    input_image="data/split/train/image_001.tif",
    label_image="data/split/train/label_001.tif",
    augmentations=[
        {"type": "rotation", "angle": [-15, 15]},  # 随机旋转
        {"type": "noise", "sigma": [0, 0.01]},      # 添加高斯噪声
        {"type": "downscale", "scales": [2, 4]}     # 模拟低分辨率影像
    ],
    num_samples=10  # 每张原图生成10个增强样本
)

项目实战案例:农业超分辨率数据集

以小麦种植区监测为例,完整数据集构建流程:

# 农业超分辨率数据集构建完整代码
from satellite_dl import AgriculturalDatasetBuilder

builder = AgriculturalDatasetBuilder(
    crop_type="wheat",
    resolution=0.5,  # 目标分辨率0.5m
    roi=[{"lon": 116.3, "lat": 39.9}, {"lon": 116.5, "lat": 40.1}]
)

# 执行全流程构建
builder.build(
    start_date="2023-03-01",
    end_date="2023-06-30",
    output_dir="datasets/wheat_sr_dataset",
    quality_threshold=0.85  # 只保留质量评分>0.85的样本
)


农业超分辨率数据集样本:左为原始10m影像,右为0.5m超分结果

数据集构建工具链总结

项目提供的完整工具链可通过以下命令快速部署:

# 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/te/techniques
cd techniques

# 安装数据采集工具链
pip install -r requirements.txt
python setup.py install

# 启动数据采集GUI工具
satellite-dl-gui

点赞+收藏本文,关注项目更新获取最新数据集构建工具。下期将推出《基于扩散模型的卫星影像超分辨率重建》,敬请期待!

完整技术文档:API参考 | 项目主页

【免费下载链接】techniques Techniques for deep learning with satellite & aerial imagery 【免费下载链接】techniques 项目地址: https://gitcode.com/gh_mirrors/te/techniques

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值