我们做遥感影像深度学习的时候,和普通图像比较主要存在4方面的问题:
(1)图像含有坐标信息
(2)图像太大,30000*30000大小
(3)图像位数是16位,普通图像是8位,都需要归一化到-1到1,或0-1,但是遥感影像虽然范围是0-65535,但是实际有效值集中在1000以内,直接除以65535,最后的归一化后,值大多数集中与0-0.04,这样做不好,需要进行拉升。
(4)多波段,普通jpg3个波段,本身tensorflow和gdal的一些图像增强的工具没法运用在多波段上,需要gdal来处理。
对于遥感影像来说,由于成像过程传感器对同一地物在不同角度拍摄会在影像上展现出不同的位置和形态,所以经过变换的样本可以使模型更好地学习地物的旋转不变的特征,从而更好地适应不同形态的图像。因此我们对训练数据进行几何变换(包括水平翻转、竖直翻转以及对角翻转)的数据增强操作。
不同程度的线性拉伸
遥感图像预处理
1 遥感影像深度学习预处理步骤
1.1 标注
用arcgis标注
1.2 训练
用gdal库
(1)遥感影像16位转8位,同时进行拉升,使值集中于-1到1或者0到1,而不是0到0.004。或者直接进行有效值的归一化本文主要解决这第1个问题,下一篇文章解决(2)和(3)的问题
(2)进行多波段读取和变换,翻转等
(3)构建dataset数据喂入神经网络
(4)输入图像不是HW3,变成HW4
(5)其它和普通都一样
1.3 预测
(1)注意给结果加坐标
2 代码实现遥感图像深度学习预处理,可以直接喂入神经网络中
共有两种方式:
(1)先转为255
2.1 转为8位,并进行拉伸,可以将图像输出也可以不输出
# 将16位遥感影像转换为8位,并进行百分比截断
# https://blog.youkuaiyun.com/qq_43814272/article/details/109741119?utm_source=app&app_version=4.1
该博客探讨了遥感影像在深度学习中的预处理挑战,包括16位图像转换为8位、归一化、数据增强等。通过代码实现,详细介绍了如何进行遥感图像的位数转换、去除黑边、归一化,以适应神经网络的输入要求,并讨论了不同拉伸方法对模型训练的影响。
订阅专栏 解锁全文
1064





