OpenCV-Python系列 - OpenCV中的GUI特性一_python opencv gui-优快云博客

本文链接：https://blog.youkuaiyun.com/zhu7478848/article/details/140253084

系列文章目录

一 OpenCV中的GUI特性
 二核心操作
三 OpenCV中的图像处理
四特征检测与描述
五视频分析
六相机校准和3D重建
七机器学习
八计算摄影学
九目标检测
十 OpenCV-Python Bindings

前言

本文主要是讲解图像基础知识和OpenCV-Python图像和视频的基础操作。

一、图像基础

图像的种类可以从多个维度进行分类，以下是一些主要的分类方式及对应的图像种类：

1.按颜色和灰度分类

    二值图像：
        图像的二维矩阵仅由0、1两个值构成，“0”代表黑色，“1”代表白色。由于每一像素取值仅有0、1两种可能，所以计算机中二值图像的数据类型通常为1个二进制位。
        应用场景：常用于文字、线条图的扫描识别（OCR）和掩膜图像的存储。
    灰度图像：
        灰度图像的矩阵元素取值范围通常为[0，255]，数据类型一般为8位无符号整数（int8）。“0”表示纯黑色，“255”表示纯白色，中间的数字表示由黑到白的过渡色。
        应用场景：广泛应用于图像处理、分析和识别等领域。
    彩色图像：
        彩色图像包含红、绿、蓝（RGB）三个颜色通道，每个通道的取值范围通常为[0，255]。通过不同颜色通道的组合，可以表示出丰富的色彩。
        应用场景：广泛应用于摄影、设计、广告等领域。

2.按文件格式分类

    JPEG（JPG）：
        最常见的图片格式之一，采用有损压缩方式处理图像数据，适合存储摄影或写实图像。
        特点：文件大小相对较小，但放大和缩小图像会失真。
    PNG：
        另一种常见的图片格式，采用无损压缩方式处理图像数据。
        特点：支持透明背景，文件大小相对JPEG较大，但放大和缩小图像不会失真。
    GIF：
        早期广泛使用的图片格式，支持透明背景和动画效果。
        特点：文件大小较小，但颜色支持较少，不适合存储色彩丰富的图像。
    WebP：
        由谷歌推出的图片格式，支持有损和无损压缩，具有更优的图像数据压缩算法。
        特点：文件大小比PNG和JPEG更小，同时支持透明和动画效果。
    SVG：
        可缩放矢量图形格式，基于XML的矢量图形描述语言。
        特点：文件大小相对较小，放大和缩小图像不会失真，适用于网络传输和动态交互。

二、图像通道

    图片通道我在实际应用中比较常见的就是三通道或者四通道。
    三通道图像指的是图像由红色（R）、绿色（G）、蓝色（B）三个颜色通道组成。（常说的图像通道顺序是RGB，但是在OpenCV中是GBR）这三个通道共同作用，产生了我们所看到的彩色图像。每个颜色通道都是一个二维矩阵（像素矩阵），矩阵中的每个元素（像素）都有一个值，这个值决定了该像素在该颜色通道中的亮度或强度。
    四通道图像是在上述三通道基础上增加了 透明度通道（Alpha通道） 。Alpha通道用于表示图像的透明度信息。在图像中加入Alpha通道后，就可以实现图像的半透明效果。Alpha通道的取值范围通常是0~255，其中0表示完全透明，255表示完全不透明。

机器中的图像：
在这里插入图片描述

三、图像入门

1.读取图像

使用cv.imread()函数读取图像。图像应该在工作目录或图像的完整路径应给出。

第二个参数是一个标志，它指定了读取图像的方式。

cv.IMREAD_COLOR：加载彩色图像。任何图像的透明度都会被忽视。它是默认标志。
cv.IMREAD_GRAYSCALE：以灰度模式加载图像
cv.IMREAD_UNCHANGED：加载图像，包括alpha通道

注意除了这三个标志，你可以分别简单地传递整数1、0或-1。

代码如下:

import numpy as np
import cv2 as cv

def main():
    # 程序的主要逻辑
    image = cv.imread(r'C:\Users\zhutianpeng\Desktop\panda.jpg',cv.IMREAD_COLOR)
    
if __name__ == "__main__":
    main()

警告: 即使图像路径错误，它也不会引发任何错误，但是print img会给出None

2.显示图像

使用函数**cv.imshow()**在窗口中显示图像。窗口自动适合图像尺寸。

第一个参数是窗口名称，它是一个字符串。第二个参数是我们的对象。你可以根据需要创建任意多个窗口，但可以使用不同的窗口名称。

import numpy as np
import cv2 as cv

def main():
    # 程序的主要逻辑
    image = cv.imread(r'C:\Users\zhutianpeng\Desktop\panda.jpg',cv.IMREAD_COLOR)
    cv.imshow('image',image)
    cv.waitKey(0)
    cv.destroyAllWindows()
    
if __name__ == "__main__":
    main()

在这里插入图片描述
cv.waitKey()是一个键盘绑定函数。其参数是以毫秒为单位的时间。该函数等待任何键盘事件指定的毫秒。如果您在这段时间内按下任何键，程序将继续运行。如果0被传递，它将无限期地等待一次敲击键。它也可以设置为检测特定的按键，例如，如果按下键 a 等。

注意:除了键盘绑定事件外，此功能还处理许多其他GUI事件，因此你必须使用它来实际显示图像。

cv.destroyAllWindows()只会破坏我们创建的所有窗口。如果要销毁任何特定的窗口，请使用函数 cv.destroyWindow()在其中传递确切的窗口名称作为参数。

注意:在特殊情况下，你可以创建一个空窗口，然后再将图像加载到该窗口。在这种情况下，你可以指定窗口是否可调整大小。这是通过功能cv.namedWindow()完成的。默认情况下，该标志为cv.WINDOW_AUTOSIZE。但是，如果将标志指定为cv.WINDOW_NORMAL，则可以调整窗口大小。当图像尺寸过大以及向窗口添加跟踪栏时，这将很有帮助。

3.写入图像

使用函数cv.imwrite()保存图像。

第一个参数是文件名，第二个参数是要保存的图像。 cv.imwrite(‘messigray.png’，img) 这会将图像以PNG格式保存在工作目录中。
在下面的程序中，以灰度加载图像，显示图像，按s保存图像并退出，或者按ESC键直接退出而不保存。

import numpy as np
import cv2 as cv

def main():
    # 程序的主要逻辑
    image = cv.imread(r'C:\Users\zhutianpeng\Desktop\panda.jpg',0)
    cv.imshow('image',image)
    k = cv.waitKey(0) & 0xFF
    if k == 27:         # 等待ESC退出
        cv.destroyAllWindows()
    elif k == ord('s'): # 等待关键字，保存和退出
        cv.imwrite('messigray.png',image)
        cv.destroyAllWindows()
    
if __name__ == "__main__":
    main()

在这里插入图片描述
保存的图像：

警告:如果使用的是64位计算机，则必须k = cv.waitKey(0)按如下所示修改行：k = cv.waitKey(0) & 0xFF

使用Matplotlib
Matplotlib是Python的绘图库，可为你提供多种绘图方法。你将在接下来的文章中看到它们。在这里，你将学习如何使用Matplotlib显示图像。你可以使用Matplotlib缩放图像，保存图像等。

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

def main():
    # 程序的主要逻辑
    image = cv.imread(r'C:\Users\zhutianpeng\Desktop\panda.jpg',0)
    plt.imshow(image, cmap = 'gray', interpolation = 'bicubic')
    plt.xticks([]), plt.yticks([])  # 隐藏 x 轴和 y 轴上的刻度值
    plt.show()
    
if __name__ == "__main__":
    main()

显示图像：
在这里插入图片描述

Matplotlib中提供了许多绘图选项。请参考Matplotlib文档以获取更多详细信息。一些，我们将在路上看到。
警告：OpenCV加载的彩色图像处于BGR模式。但是Matplotlib以RGB模式显示。因此，如果使用OpenCV读取彩色图像，则Matplotlib中将无法正确显示彩色图像。

其他资源：Matplotlib绘图样式和功能：Matplotlib

四、视频入门

1.从相机中读取视频

通常情况下，我们必须用摄像机捕捉实时画面。提供了一个非常简单的界面。让我们从摄像头捕捉一段视频(我使用的是我笔记本电脑内置的网络摄像头) ，将其转换成灰度视频并显示出来。
要捕获视频，你需要创建一个 VideoCapture 对象。它的参数可以是设备索引或视频文件的名称。设备索引就是指定哪个摄像头的数字。正常情况下，一个摄像头会被连接(就像我的情况一样)。所以我简单地传0(或-1)。你可以通过传递1来选择第二个相机，以此类推。在此之后，你可以逐帧捕获。但是在最后，不要忘记释放。

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

def main():
    cap = cv.VideoCapture(0)
    if not cap.isOpened