OpenCV基础入门（1）：从底层原理到实战应用的图像视频处理技术

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉库
它提供了丰富的图像处理和计算机视觉算法，涵盖了图像读取与显示、滤波、特征检测、目标跟踪、模式识别等众多功能
在 PyCharm 等集成开发环境中，结合 Python 版本的 OpenCV（通常称为opencv-python），开发者可以高效地实现各类计算机视觉任务，广泛应用于机器人视觉、视频监控、医学影像分析、自动驾驶等领域。

二、OpenCV环境安装

1.基于pip安装

pip是Python的包管理工具，适用于大多数Python环境

在PyCharm的界面中打开终端窗口，输入命令安装opencv-python：

pip install opencv-python

如需要额外的扩展模块，可安装opencv-contrib-python：

pip install opencv-contrib-python

2.基于conda安装

conda是 Anaconda或Miniconda自带的包管理工具。适合管理包含多个依赖的Python环境。

在PyCharm中关联已安装的conda环境（如base环境或自定义环境，个人建议使用自定义环境）-- 具体操作请看https://blog.youkuaiyun.com/TTTYYZ/article/details/149331228?spm=1011.2415.3001.5331https://blog.youkuaiyun.com/TTTYYZ/article/details/149331228?spm=1011.2415.3001.5331
本人是使用的Anaconda，先在Anaconda Prompt中输入命令激活目标conda环境（我这里是envai）

conda activate envai

输入下列命令安装OpenCV（conda仓库中的包名为opencv）

# 其中-c conda-forge指定从 conda-forge渠道安装，该渠道的包更新更及时。
conda install -c conda-forge opencv

三、图像的表示与存储

1. 像素与矩阵

图像由大量像素组成，在 OpenCV 中以 NumPy 数组（矩阵）的形式表示。

对于灰度图像，矩阵的每个元素代表一个像素的灰度值（0-255，0 为黑色，255 为白色）；对于彩色图像，通常采用 BGR（蓝、绿、红）通道顺序（与常见的 RGB 顺序不同），矩阵形状为(高度, 宽度, 3)，即(rows, cols, channels)。

彩色图像：三维数组，灰度图像：二维数组

2. 数据类型

像素值通常以uint8（8 位无符号整数）类型存储，范围 0-255；也可根据需求转换为float32等类型（如用于某些需要浮点运算的算法）

四、图像的基本操作

1.图像的读取与显示

读取图像：使用cv2.imread(path[,读取方式])函数，语法为：

import cv2 as cv

# 读取图像 cv.imread(path ,读取方式)默认读为彩色图
cat = cv.imread("../images/1.jpg")
# 显示为灰度图 二维
cat1 = cv.imread("../images/1.jpg", cv.IMREAD_GRAYSCALE)

./ 表示当前目录

显示图像：使用cv2.imshow(winname,img)显示图像，配合cv2.waitKey()和cv2.destroyAllWindows()控制窗口：

import cv2 as cv

cat1 = cv.imread("../images/1.jpg")
cv.imshow("cat1", cat1)  # 显示图片，winname：窗口名，img：图片
cv.waitKey(0)  # 等待时间，0表示任意键终止程序，大于零时表示程序等待毫秒数
cv.destroyAllWindows()  # 关闭所有窗口（释放资源）

2.图像的保存和属性获取

使用cv2.imwrite()函数保存图像，语法为：

import cv2 as cv
# 保存图像 cv.imwrite(path,img) path：图片保存的路径和图片名,img：需要保存的图片
cv.imwrite("./1.jpg", cat)

通过Numpy数组属性可获取图像的基本信息：

import cv2 as cv
cat = cv.imread("../images/1.jpg")
print(cat.shape)  # 打印图片尺寸(高，宽，通道数)元组
print(cat.size)  # 打印图片大小，h * w * c

3.黑白图像的创建

结合Numpy数组的函数方法可创建

创建全0数组表示黑色图像

import cv2 as cv

# 创建全0数组 表示黑色图像
# (512,512,3) 表示高512行，高512列，3通道
black = np.zeros((512, 512, 3), dtype=np.uint8)
cv.imshow('black', black)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口

使用np.full()创建白色图像

import cv2 as cv

# 使用np.full()创建白色图像
white = np.full((512, 512, 3), 255, dtype=np.uint8)
cv.imshow('white', white)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口

索引修改像素值表示白色图像

import cv2 as cv

# 索引修改像素值 表示白色图像
black[:, :, :] = 255  # 选择高宽所有像素点，改成[b, g, r] = [255, 255, 255]
black[:, :] = 255
black[:] = 255
cv.imshow('black', black)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口

随机像素值

import cv2 as cv
# 随机像素值
color = np.random.randint(0, 256, (240, 320, 3), dtype=np.uint8) # 随机生成0-255的数
cv.imshow('color', color)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口

4.图片切片（图片裁剪）与大小调整

使用cv2.resize()函数，可指定目标尺寸或缩放比例：

import cv2 as cv

# 读取图片
flower = cv.imread("../images/flower.png")
# cv.imshow("flower", flower)
# 调整图片，resize传参是先宽在高，shape是先高在宽
flower1 = cv.resize(flower, (flower.shape[1]//2, flower.shape[0]//2))
cv.imshow("flower1", flower1)
cv.waitKey(0)
cv.destroyAllWindows()

通过NumPy数组切片实现，如果有一个图像img，语法为img[行范围，列范围]：

import cv2 as cv
flower = cv.imread("../images/flower.png")
# 切片x,y 106,164 237,320
flower2 = flower[164:320, 106:237]
cv.imshow("flower2", flower2)
# x,y 290,80 398,172
flower3 = flower1[80:172, 290:398]
cv.imshow("flower3", flower3)
cv.waitKey(0)
cv.destroyAllWindows()

五、图像绘制

1.绘制直线和圆形

绘制直线cv2.line(img, start, end, color, thickness)，img：目标图像，start：(起点宽度，起点高度)，end：(终点宽度，终点高度)，color：颜色(b，g，r)，thickness：线宽，语法为：

import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制直线 cv2.line(img,start,end,color,thickness) (w,h)
cv.line(cat, (50, 40), (100, 40), (100, 0, 0), 2)

绘制圆形cv2.circle(img, center, radius, color, thickness)，center：圆心坐标，radius：半径，其他与直线一致。

import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制圆，cv2.circle(img,center,r,color,thickness)
# cv.LINE_AA:反走样技术，抗锯齿平滑 默认使用的是LINE_8
cv.circle(cat, (325, 269), 30, (0, 100, 0), 2, cv.LINE_AA)

2.绘制矩形和文本（向图片添加文字）

绘制矩形cv2.rectangle(img,lefttop,rightbottom,color,thickness)，lefttop：矩形左上角坐标；rightbottom：矩形右下角坐标；其他参数同直线。若thickness为-1，则填充矩形。

import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制矩形，cv2.rectangle(img,lefttop,rightbottom,color,thickness) thickness表示线条粗细如果为-1表示填充
cv.rectangle(cat, (78, 106), (245, 306), (0, 0, 140), 2)

绘制文本cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)，text:要写入的文本数据，station：文本的放置位置，font：字体样式，Fontscale：字体大小

import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制文本（向图片中添加文字），cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)
# text:要写入的文本数据，station：文本的放置位置，font：字体样式，Fontscale：字体大小
cv.putText(cat,'这是一只猫', (30,30), cv.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

3.读取视频

读取视频cap = cv2.VideoCapture(path)，path:视频流资源路径设置为0,代表从默认摄像头捕获视频流
ret，frame = cap.read()，返回值cap调用read()方法得到一个布尔值和一帧图像

读取视频文件：

import cv2 as cv
# 创建一个videocapture对象,播放视频
cap = cv.VideoCapture('../images/videocap.mp4')
# 循环读取每一帧图像
while True:
    # 调用read（）方法，读取每一帧图像,得到一个布尔值和一帧图像
    ret, img = cap.read()
    # 判断是否读取成功
    if not ret:
        print('error!')
        break
    cv.imshow('img', img)
    if cv.waitKey(5) & 0xFF == ord('q'):
        print('按键退出')
        break

cv.destroyAllWindows()

捕获摄像头的实时视频流：

import cv2 as cv

# 打开摄像头
cap = cv.VideoCapture(0)
# 循环读取每一帧图像
while True:
    # 调用read（）方法，读取每一帧图像,得到一个布尔值和一帧图像
    ret, img = cap.read()
    # 判断是否读取成功
    if not ret:
        print('error!')
        break
    cv.imshow('img', img)
    if cv.waitKey(5) & 0xFF == ord('q'):
        print('按键退出')
        break

cv.destroyAllWindows()