OpenCV-Python中的函数cv.imread()读取到的图像的数据存储结构是怎样的?
用一个例子实测一下就知道了。
测试代码如下:
import numpy as np
import cv2 as cv
src = cv.imread("F:/material/images/P0037-pure_red-02.bmp")
代码中用的图像下载链接:
链接:https://pan.baidu.com/s/1ldfJmdUnq_Os7QPGS8njyA 提取码:pltg
该图像是一张纯红色的图像,其属性如下图所示:

上面的代码运行后src的属性如下:



上图代表第0行第0列的像素点的BGR分量分别为(0,0,254)
可见,其数据结构为:
最高维度代表图像有多少行,是图像的行维度。
第2维度代表图像有多少列,是图像的列维度。
第3维度代表图像有几个通道,是图像的通道维度。
这与我们通常想象的顺序不一样,我们看下面这个例子:
import numpy as np
B = np.array([[[11, 12, 13, 14],
[15, 16, 17, 18]],
[[19, 20, 21, 22],
[23, 24, 25, 26]],
[[27, 28, 29, 30],
[31, 32, 33, 34]]])
上面的代码中,B矩阵为三通道、两行、四列,运行代码后,B中的数据结构如下:

可见在这里:
最高维度是通道维度(代表有几个通道),其次是行维度(代表多少行),最后是列维度(代表多少列)。
而上面用函数cv.imread()读取到的图像的数据存储结构如下图所示:

从图中可以看出:
用函数cv.imread()读取到的图像的数据存储结构“最高维度是行维度(代表多少行),其次是列维度(代表多少列),最后是通道维度(代表有几个通道)”。
这一点,我们必须清楚,如果连这一点都不清楚,我们在进行图像处理时就是处于迷糊状态。

本文通过实例探讨了OpenCV-Python的cv.imread()函数读取图像后的数据存储结构。图像数据以BGR通道顺序存储,最高维度表示行,其次为列,最后是通道。这种顺序与某些numpy数组的维度顺序不同,理解这一特点对于进行图像处理至关重要。
3914

被折叠的 条评论
为什么被折叠?



