图像数据处理与特征提取技术解析
1. 仿射变换与数据集扩展
在处理图像数据时,仿射变换是一项重要技术。仿射变换是将源平面上的三个点映射到目标平面上的三个点所定义的线性变换,从数学角度看,它由一个 2×2 矩阵乘法后加一个 2×1 向量来定义,能捕捉平移、缩放和旋转。在卫星图像的处理中,平移最多 10 个像素可反映城市中心位置的误差,无限制的旋转反映城市轴线的不同可能对齐方式,而缩放对于处理存在南北方向不均匀压缩的数据尤为重要。
为了评估仿射变换对未见过数据的影响,我们进行了相关实验。实验中,几乎所有变换都需要 32×32 正方形之外的像素,所以早期提取了 64×64 的框,后续再提取相应的 32×32 正方形。通过将这些变化样本与基础图像进行对比评估,记录修改后的图像在输入原始回归器时比基础图像产生更准确结果的次数,以及误差减半的次数。结果显示,在近 1500 张图像的 13649 次尝试中,有 6072 次有改进,1777 次误差减半,这表明模型较为脆弱,小的变化会导致行为的剧烈改变。
为了让模型更健壮,我们可以通过使用这些变体扩展训练集。在计算机视觉(CV)中,向机器学习(ML)过程添加关于哪些变换不携带信息(即无用变化)的领域知识是一种有效的技术。对于卫星图像,我们探索了上述的三种仿射变换。
2. 特征提取与模型训练
- 第二次特征化 :使用四个实例(基础图像加上三个具有相同参数的随机变体)对每个城市进行训练,共 143884 个实例。有趣的是,仅使用非像素特征作为基线模型的结果比之前特征化的基线模型差很多,这是因为逐字重复行会使随机森林(RF)过于信任某些特征配置而导致过拟合,这也
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



