参考转载:OpenCV 笔记(24):图像金字塔
志哥先读:
其实图像的尺度空间可以理解为 模拟人眼远近视觉效果的一种方式。这一理论主要基于人眼在观察不同距离的物体时,对物体细节和整体轮廓的感知能力会发生变化。具体来说,图像的尺度空间是指图像经过几个不同高斯核后形成的模糊图片的集合,这些图片模拟了人眼在不同距离观察物体时的视觉效果。
- 尺度:在图像处理中,尺度指的是图像内容的粗细程度,用于模拟观察者距离物体的远近程度。当观察者距离物体较远时,只能看到物体的大概轮廓;而当距离较近时,则能更清晰地看到物体的细节,如纹理、表面的粗糙度等。
- 尺度空间:因此,图像的尺度空间就是一幅图像在不同尺度(即不同模糊程度)下的表示集合。这些表示通过应用不同参数的高斯核进行高斯滤波得到,从而模拟了人眼在不同距离下对物体的感知。
反正记住一点,尺度不是指图像分辨率尺寸,是模拟人眼的观察距离。或者再用一个更容易理解的举例,就是模拟人类不同的近视眼度数!
0. 尺度空间和图像金字塔
尺度空间是图像在不同尺度下的连续表示。其中最常见的是使用高斯核对图像进行卷积。高斯滤波可以平滑图像,从而消除图像中的细微细节。随着高斯滤波核尺度的增加,图像变得越来越平滑,直到只剩下最基本的特征。
图像金字塔是尺度空间的一种具体实现方式。它是由一系列不同分辨率的图像组成,这些图像以金字塔的形状排列如下图所示。
常见的图像金字塔有以下几种:
-
高斯金字塔(Gaussian Pyramid):高斯金字塔是通过对图像进行高斯滤波和下采样来构建的。高斯滤波可以平滑图像,下采样可以降低图像的分辨率。高斯金字塔具有尺度不变性,可以用于尺度不变的图像处理任务。
-
DoG 金字塔(Difference of Gaussians Pyramid):DoG 金