目录
一、OpenCV简介
- OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库
- 它提供了丰富的图像处理和计算机视觉算法,涵盖了图像读取与显示、滤波、特征检测、目标跟踪、模式识别等众多功能
- 在 PyCharm 等集成开发环境中,结合 Python 版本的 OpenCV(通常称为
opencv-python),开发者可以高效地实现各类计算机视觉任务,广泛应用于机器人视觉、视频监控、医学影像分析、自动驾驶等领域。
二、OpenCV环境安装
1.基于pip安装
pip是Python的包管理工具,适用于大多数Python环境
- 在PyCharm的界面中打开终端窗口,输入命令安装opencv-python:
pip install opencv-python
- 如需要额外的扩展模块,可安装opencv-contrib-python:
pip install opencv-contrib-python
2.基于conda安装
conda是 Anaconda或Miniconda自带的包管理工具。适合管理包含多个依赖的Python环境。
- 在PyCharm中关联已安装的conda环境(如base环境或自定义环境,个人建议使用自定义环境)-- 具体操作请看https://blog.youkuaiyun.com/TTTYYZ/article/details/149331228?spm=1011.2415.3001.5331
https://blog.youkuaiyun.com/TTTYYZ/article/details/149331228?spm=1011.2415.3001.5331 - 本人是使用的Anaconda,先在Anaconda Prompt中输入命令激活目标conda环境(我这里是envai)
conda activate envai
- 输入下列命令安装OpenCV(conda仓库中的包名为opencv)
# 其中-c conda-forge指定从 conda-forge渠道安装,该渠道的包更新更及时。
conda install -c conda-forge opencv
三、图像的表示与存储
1. 像素与矩阵
图像由大量像素组成,在 OpenCV 中以 NumPy 数组(矩阵)的形式表示。
对于灰度图像,矩阵的每个元素代表一个像素的灰度值(0-255,0 为黑色,255 为白色);对于彩色图像,通常采用 BGR(蓝、绿、红)通道顺序(与常见的 RGB 顺序不同),矩阵形状为(高度, 宽度, 3),即(rows, cols, channels)。
彩色图像:三维数组,灰度图像:二维数组
2. 数据类型
像素值通常以uint8(8 位无符号整数)类型存储,范围 0-255;也可根据需求转换为float32等类型(如用于某些需要浮点运算的算法)
四、图像的基本操作
1.图像的读取与显示
- 读取图像:使用cv2.imread(path[,读取方式])函数,语法为:
import cv2 as cv
# 读取图像 cv.imread(path ,读取方式)默认读为彩色图
cat = cv.imread("../images/1.jpg")
# 显示为灰度图 二维
cat1 = cv.imread("../images/1.jpg", cv.IMREAD_GRAYSCALE)
./ 表示当前目录
../ 表示当前目录的上一级目录
- 显示图像:使用cv2.imshow(winname,img)显示图像,配合cv2.waitKey()和cv2.destroyAllWindows()控制窗口:
import cv2 as cv
cat1 = cv.imread("../images/1.jpg")
cv.imshow("cat1", cat1) # 显示图片,winname:窗口名,img:图片
cv.waitKey(0) # 等待时间,0表示任意键终止程序,大于零时表示程序等待毫秒数
cv.destroyAllWindows() # 关闭所有窗口(释放资源)
2.图像的保存和属性获取
- 使用cv2.imwrite()函数保存图像,语法为:
import cv2 as cv
# 保存图像 cv.imwrite(path,img) path:图片保存的路径和图片名,img:需要保存的图片
cv.imwrite("./1.jpg", cat)
- 通过Numpy数组属性可获取图像的基本信息:
import cv2 as cv
cat = cv.imread("../images/1.jpg")
print(cat.shape) # 打印图片尺寸(高,宽,通道数)元组
print(cat.size) # 打印图片大小,h * w * c
3.黑白图像的创建
结合Numpy数组的函数方法可创建
- 创建全0数组 表示黑色图像
import cv2 as cv
# 创建全0数组 表示黑色图像
# (512,512,3) 表示高512行,高512列,3通道
black = np.zeros((512, 512, 3), dtype=np.uint8)
cv.imshow('black', black)
cv.waitKey(0)
cv.destroyAllWindows() # 销毁所有窗口
- 使用np.full()创建白色图像
import cv2 as cv
# 使用np.full()创建白色图像
white = np.full((512, 512, 3), 255, dtype=np.uint8)
cv.imshow('white', white)
cv.waitKey(0)
cv.destroyAllWindows() # 销毁所有窗口
- 索引修改像素值表示白色图像
import cv2 as cv
# 索引修改像素值 表示白色图像
black[:, :, :] = 255 # 选择高宽所有像素点,改成[b, g, r] = [255, 255, 255]
black[:, :] = 255
black[:] = 255
cv.imshow('black', black)
cv.waitKey(0)
cv.destroyAllWindows() # 销毁所有窗口
- 随机像素值
import cv2 as cv
# 随机像素值
color = np.random.randint(0, 256, (240, 320, 3), dtype=np.uint8) # 随机生成0-255的数
cv.imshow('color', color)
cv.waitKey(0)
cv.destroyAllWindows() # 销毁所有窗口
4.图片切片(图片裁剪)与大小调整
- 使用cv2.resize()函数,可指定目标尺寸或缩放比例:
import cv2 as cv
# 读取图片
flower = cv.imread("../images/flower.png")
# cv.imshow("flower", flower)
# 调整图片,resize传参是先宽在高,shape是先高在宽
flower1 = cv.resize(flower, (flower.shape[1]//2, flower.shape[0]//2))
cv.imshow("flower1", flower1)
cv.waitKey(0)
cv.destroyAllWindows()
- 通过NumPy数组切片实现,如果有一个图像img,语法为img[行范围,列范围]:
import cv2 as cv
flower = cv.imread("../images/flower.png")
# 切片x,y 106,164 237,320
flower2 = flower[164:320, 106:237]
cv.imshow("flower2", flower2)
# x,y 290,80 398,172
flower3 = flower1[80:172, 290:398]
cv.imshow("flower3", flower3)
cv.waitKey(0)
cv.destroyAllWindows()
五、图像绘制
1.绘制直线和圆形
- 绘制直线cv2.line(img, start, end, color, thickness),img:目标图像,start:(起点宽度,起点高度),end:(终点宽度,终点高度),color:颜色(b,g,r),thickness:线宽,语法为:
import cv2 as cv
cat = cv.imread("../images/1.jpg")
# 绘制直线 cv2.line(img,start,end,color,thickness) (w,h)
cv.line(cat, (50, 40), (100, 40), (100, 0, 0), 2)
- 绘制圆形cv2.circle(img, center, radius, color, thickness),
center:圆心坐标,radius:半径,其他与直线一致。
import cv2 as cv
cat = cv.imread("../images/1.jpg")
# 绘制圆,cv2.circle(img,center,r,color,thickness)
# cv.LINE_AA:反走样技术,抗锯齿平滑 默认使用的是LINE_8
cv.circle(cat, (325, 269), 30, (0, 100, 0), 2, cv.LINE_AA)
2.绘制矩形和文本(向图片添加文字)
- 绘制矩形cv2.rectangle(img,lefttop,rightbottom,color,thickness),
lefttop:矩形左上角坐标;rightbottom:矩形右下角坐标;其他参数同直线。若thickness为-1,则填充矩形。
import cv2 as cv
cat = cv.imread("../images/1.jpg")
# 绘制矩形,cv2.rectangle(img,lefttop,rightbottom,color,thickness) thickness表示线条粗细如果为-1表示填充
cv.rectangle(cat, (78, 106), (245, 306), (0, 0, 140), 2)
- 绘制文本cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA),text:要写入的文本数据,station:文本的放置位置,font:字体样式,Fontscale:字体大小
import cv2 as cv
cat = cv.imread("../images/1.jpg")
# 绘制文本(向图片中添加文字),cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)
# text:要写入的文本数据,station:文本的放置位置,font:字体样式,Fontscale:字体大小
cv.putText(cat,'这是一只猫', (30,30), cv.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)
3.读取视频
- 读取视频cap = cv2.VideoCapture(path),path:视频流资源路径设置为0,代表从默认摄像头捕获视频流
- ret,frame = cap.read(),返回值cap调用read()方法得到一个布尔值和一帧图像
读取视频文件:
import cv2 as cv
# 创建一个videocapture对象,播放视频
cap = cv.VideoCapture('../images/videocap.mp4')
# 循环读取每一帧图像
while True:
# 调用read()方法,读取每一帧图像,得到一个布尔值和一帧图像
ret, img = cap.read()
# 判断是否读取成功
if not ret:
print('error!')
break
cv.imshow('img', img)
if cv.waitKey(5) & 0xFF == ord('q'):
print('按键退出')
break
cv.destroyAllWindows()
捕获摄像头的实时视频流:
import cv2 as cv
# 打开摄像头
cap = cv.VideoCapture(0)
# 循环读取每一帧图像
while True:
# 调用read()方法,读取每一帧图像,得到一个布尔值和一帧图像
ret, img = cap.read()
# 判断是否读取成功
if not ret:
print('error!')
break
cv.imshow('img', img)
if cv.waitKey(5) & 0xFF == ord('q'):
print('按键退出')
break
cv.destroyAllWindows()
9万+

被折叠的 条评论
为什么被折叠?



