我们做遥感影像深度学习的时候,和普通图像比较主要存在4方面的问题:
(1)图像含有坐标信息
(2)图像太大,30000*30000大小
(3)图像位数是16位,普通图像是8位,都需要归一化到-1到1,或0-1,但是遥感影像虽然范围是0-65535,但是实际有效值集中在1000以内,直接除以65535,最后的归一化后,值大多数集中与0-0.04,这样做不好,需要进行拉升。
(4)多波段,普通jpg3个波段,本身tensorflow和gdal的一些图像增强的工具没法运用在多波段上,需要gdal来处理。
对于遥感影像来说,由于成像过程传感器对同一地物在不同角度拍摄会在影像上展现出不同的位置和形态,所以经过变换的样本可以使模型更好地学习地物的旋转不变的特征,从而更好地适应不同形态的图像。因此我们对训练数据进行几何变换(包括水平翻转、竖直翻转以及对角翻转)的数据增强操作。
不同程度的线性拉伸
遥感图像预处理
1 遥感影像深度学习预处理步骤
1.1 标注
用arcgis标注