想象一下,你有一张印着某个明显标志的纸张,例如一个黑色的字母 “X”。你将这张纸放在桌子上,用相机拍下了一张照片。然后,你将纸张顺时针旋转45度,并再次拍照。尽管纸张的方向变了,但上面的 “X” 还是那个 “X”,并没有改变。
为了使这个例子更具体,我们可以为 “X” 指定一个特征,例如轮廓的中心点或者 “X” 的两条线交叉的地方。不管你如何旋转纸张,这个中心点是 “X” 的一个固有特性,它并不改变。
同样地,图像的旋转不变性就意味着无论你如何旋转图像,能够检测到的图像特征(像是关键点或边缘)还是同一个特征,只是它在图像中的位置改变了。在计算机视觉中,算法设计为可以识别这些特征的不变性,从而无论图像如何旋转,都可以匹配到相同的物体或图案。
回到我们的 “X” 标志例子。在计算机视觉任务中,如果你用一种旋转不变性算法去识别并匹配这个 “X” 标志,算法能够在两张图片中都识别出 “X” 标志,尽管它们的方向不同。这就是图像的旋转不变性的直观理解。
假设我们有一个图像,如下所示:
A B C
D E F
G H I
现在,我们通过逆时针旋转该图像90度:
G D A
H E B
I F C
如果我们只看像素的位置,两个图像是不同的。然而,如果我们在两个图像上检测特征点并计算它们的描述符,我们将会注意到,它们的描述符是相同的。
关键点是在图像中具有某种特殊性质的点,描述符是它们周围像素的表示。通过计算描述符,我们可以捕捉特征点的一些特征,例如边缘方向、纹理等。
在上述例子中,旋转后的图像仍然具有相同的边缘、纹理等特征,因此,在旋转后的图像上检测到的