OpenCV-Python中的函数cv.imread()读取到的图像的数据存储结构是怎样的？

原创已于 2022-04-26 11:07:06 修改 · 6.4k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#cv.imread数据存储结构

于 2022-04-26 11:04:02 首次发布

图像处理原理、工具、代码同时被 2 个专栏收录

280 篇文章

订阅专栏

Python基础

114 篇文章

订阅专栏

本文通过实例探讨了OpenCV-Python的cv.imread()函数读取图像后的数据存储结构。图像数据以BGR通道顺序存储，最高维度表示行，其次为列，最后是通道。这种顺序与某些numpy数组的维度顺序不同，理解这一特点对于进行图像处理至关重要。

OpenCV-Python中的函数cv.imread()读取到的图像的数据存储结构是怎样的？

用一个例子实测一下就知道了。
测试代码如下：

import numpy as np
import cv2 as cv

src = cv.imread("F:/material/images/P0037-pure_red-02.bmp")

代码中用的图像下载链接：
链接：https://pan.baidu.com/s/1ldfJmdUnq_Os7QPGS8njyA 提取码：pltg
该图像是一张纯红色的图像，其属性如下图所示：
在这里插入图片描述
上面的代码运行后src的属性如下：

上图代表第0行第0列的像素点的BGR分量分别为(0,0,254)

可见，其数据结构为：
最高维度代表图像有多少行，是图像的行维度。
第2维度代表图像有多少列，是图像的列维度。
第3维度代表图像有几个通道，是图像的通道维度。

这与我们通常想象的顺序不一样，我们看下面这个例子：

import numpy as np

B = np.array([[[11, 12, 13, 14],
               [15, 16, 17, 18]],
              [[19, 20, 21, 22],
               [23, 24, 25, 26]],
              [[27, 28, 29, 30],
               [31, 32, 33, 34]]])

上面的代码中，B矩阵为三通道、两行、四列，运行代码后，B中的数据结构如下：
在这里插入图片描述
可见在这里：
最高维度是通道维度(代表有几个通道)，其次是行维度(代表多少行)，最后是列维度(代表多少列)。
而上面用函数cv.imread()读取到的图像的数据存储结构如下图所示：

从图中可以看出：
用函数cv.imread()读取到的图像的数据存储结构“最高维度是行维度(代表多少行)，其次是列维度(代表多少列)，最后是通道维度(代表有几个通道)”。
这一点，我们必须清楚，如果连这一点都不清楚，我们在进行图像处理时就是处于迷糊状态。