OpenCV基础入门(1):从底层原理到实战应用的图像视频处理技术

目录

一、OpenCV简介

二、OpenCV环境安装

1.基于pip安装

2.基于conda安装

三、图像的表示与存储

1. 像素与矩阵

2. 数据类型

四、图像的基本操作

1.图像的读取与显示

2.图像的保存和属性获取

3.黑白图像的创建

4.图片切片(图片裁剪)与大小调整

五、图像绘制

1.绘制直线和圆形

2.绘制矩形和文本(向图片添加文字)

3.读取视频


一、OpenCV简介

  • OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库
  • 它提供了丰富的图像处理和计算机视觉算法,涵盖了图像读取与显示、滤波、特征检测、目标跟踪、模式识别等众多功能
  • 在 PyCharm 等集成开发环境中,结合 Python 版本的 OpenCV(通常称为opencv-python),开发者可以高效地实现各类计算机视觉任务,广泛应用于机器人视觉、视频监控、医学影像分析、自动驾驶等领域。

二、OpenCV环境安装

1.基于pip安装

pip是Python的包管理工具,适用于大多数Python环境

  • 在PyCharm的界面中打开终端窗口,输入命令安装opencv-python:
pip install opencv-python
  • 如需要额外的扩展模块,可安装opencv-contrib-python:
pip install opencv-contrib-python

2.基于conda安装

conda是 Anaconda或Miniconda自带的包管理工具。适合管理包含多个依赖的Python环境。

conda activate envai
  • 输入下列命令安装OpenCV(conda仓库中的包名为opencv)
# 其中-c conda-forge指定从 conda-forge渠道安装,该渠道的包更新更及时。
conda install -c conda-forge opencv

三、图像的表示与存储

1. 像素与矩阵

        图像由大量像素组成,在 OpenCV 中以 NumPy 数组(矩阵)的形式表示。

        对于灰度图像,矩阵的每个元素代表一个像素的灰度值(0-255,0 为黑色,255 为白色);对于彩色图像,通常采用 BGR(蓝、绿、红)通道顺序(与常见的 RGB 顺序不同),矩阵形状为(高度, 宽度, 3),即(rows, cols, channels)

        彩色图像:三维数组,灰度图像:二维数组

2. 数据类型

        像素值通常以uint8(8 位无符号整数)类型存储,范围 0-255;也可根据需求转换为float32等类型(如用于某些需要浮点运算的算法)

四、图像的基本操作

1.图像的读取与显示

  • 读取图像:使用cv2.imread(path[,读取方式])函数,语法为:
import cv2 as cv

# 读取图像 cv.imread(path ,读取方式)默认读为彩色图
cat = cv.imread("../images/1.jpg")
# 显示为灰度图 二维
cat1 = cv.imread("../images/1.jpg", cv.IMREAD_GRAYSCALE)

./ 表示当前目录

../ 表示当前目录的上一级目录

  • 显示图像:使用cv2.imshow(winname,img)显示图像,配合cv2.waitKey()和cv2.destroyAllWindows()控制窗口:
import cv2 as cv

cat1 = cv.imread("../images/1.jpg")
cv.imshow("cat1", cat1)  # 显示图片,winname:窗口名,img:图片
cv.waitKey(0)  # 等待时间,0表示任意键终止程序,大于零时表示程序等待毫秒数
cv.destroyAllWindows()  # 关闭所有窗口(释放资源)

2.图像的保存和属性获取

  • 使用cv2.imwrite()函数保存图像,语法为:
import cv2 as cv
# 保存图像 cv.imwrite(path,img) path:图片保存的路径和图片名,img:需要保存的图片
cv.imwrite("./1.jpg", cat)
  • 通过Numpy数组属性可获取图像的基本信息:
import cv2 as cv
cat = cv.imread("../images/1.jpg")
print(cat.shape)  # 打印图片尺寸(高,宽,通道数)元组
print(cat.size)  # 打印图片大小,h * w * c

3.黑白图像的创建

结合Numpy数组的函数方法可创建

  • 创建全0数组 表示黑色图像
import cv2 as cv

# 创建全0数组 表示黑色图像
# (512,512,3) 表示高512行,高512列,3通道
black = np.zeros((512, 512, 3), dtype=np.uint8)
cv.imshow('black', black)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口
  • 使用np.full()创建白色图像
import cv2 as cv

# 使用np.full()创建白色图像
white = np.full((512, 512, 3), 255, dtype=np.uint8)
cv.imshow('white', white)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口
  • 索引修改像素值表示白色图像
import cv2 as cv

# 索引修改像素值 表示白色图像
black[:, :, :] = 255  # 选择高宽所有像素点,改成[b, g, r] = [255, 255, 255]
black[:, :] = 255
black[:] = 255
cv.imshow('black', black)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口
  • 随机像素值
import cv2 as cv
# 随机像素值
color = np.random.randint(0, 256, (240, 320, 3), dtype=np.uint8) # 随机生成0-255的数
cv.imshow('color', color)
cv.waitKey(0)
cv.destroyAllWindows()  # 销毁所有窗口

4.图片切片(图片裁剪)与大小调整

  • 使用cv2.resize()函数,可指定目标尺寸或缩放比例:
import cv2 as cv

# 读取图片
flower = cv.imread("../images/flower.png")
# cv.imshow("flower", flower)
# 调整图片,resize传参是先宽在高,shape是先高在宽
flower1 = cv.resize(flower, (flower.shape[1]//2, flower.shape[0]//2))
cv.imshow("flower1", flower1)
cv.waitKey(0)
cv.destroyAllWindows()
  • 通过NumPy数组切片实现,如果有一个图像img,语法为img[行范围,列范围]:
import cv2 as cv
flower = cv.imread("../images/flower.png")
# 切片x,y 106,164 237,320
flower2 = flower[164:320, 106:237]
cv.imshow("flower2", flower2)
# x,y 290,80 398,172
flower3 = flower1[80:172, 290:398]
cv.imshow("flower3", flower3)
cv.waitKey(0)
cv.destroyAllWindows()

五、图像绘制

1.绘制直线和圆形

  • 绘制直线cv2.line(img, start, end, color, thickness),img:目标图像,start:(起点宽度,起点高度),end:(终点宽度,终点高度),color:颜色(b,g,r),thickness:线宽,语法为:
import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制直线 cv2.line(img,start,end,color,thickness) (w,h)
cv.line(cat, (50, 40), (100, 40), (100, 0, 0), 2)
  • 绘制圆形cv2.circle(img, center, radius, color, thickness),center:圆心坐标,radius:半径,其他与直线一致。
import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制圆,cv2.circle(img,center,r,color,thickness)
# cv.LINE_AA:反走样技术,抗锯齿平滑 默认使用的是LINE_8
cv.circle(cat, (325, 269), 30, (0, 100, 0), 2, cv.LINE_AA)

2.绘制矩形和文本(向图片添加文字)

  • 绘制矩形cv2.rectangle(img,lefttop,rightbottom,color,thickness),lefttop:矩形左上角坐标;rightbottom:矩形右下角坐标;其他参数同直线。若thickness-1,则填充矩形。
import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制矩形,cv2.rectangle(img,lefttop,rightbottom,color,thickness) thickness表示线条粗细如果为-1表示填充
cv.rectangle(cat, (78, 106), (245, 306), (0, 0, 140), 2)
  • 绘制文本cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA),text:要写入的文本数据,station:文本的放置位置,font:字体样式,Fontscale:字体大小
import cv2 as cv

cat = cv.imread("../images/1.jpg")
# 绘制文本(向图片中添加文字),cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)
# text:要写入的文本数据,station:文本的放置位置,font:字体样式,Fontscale:字体大小
cv.putText(cat,'这是一只猫', (30,30), cv.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

3.读取视频

  • 读取视频cap = cv2.VideoCapture(path),path:视频流资源路径设置为0,代表从默认摄像头捕获视频流
  • ret,frame = cap.read(),返回值cap调用read()方法得到一个布尔值和一帧图像

读取视频文件:

import cv2 as cv
# 创建一个videocapture对象,播放视频
cap = cv.VideoCapture('../images/videocap.mp4')
# 循环读取每一帧图像
while True:
    # 调用read()方法,读取每一帧图像,得到一个布尔值和一帧图像
    ret, img = cap.read()
    # 判断是否读取成功
    if not ret:
        print('error!')
        break
    cv.imshow('img', img)
    if cv.waitKey(5) & 0xFF == ord('q'):
        print('按键退出')
        break

cv.destroyAllWindows()

捕获摄像头的实时视频流:

import cv2 as cv

# 打开摄像头
cap = cv.VideoCapture(0)
# 循环读取每一帧图像
while True:
    # 调用read()方法,读取每一帧图像,得到一个布尔值和一帧图像
    ret, img = cap.read()
    # 判断是否读取成功
    if not ret:
        print('error!')
        break
    cv.imshow('img', img)
    if cv.waitKey(5) & 0xFF == ord('q'):
        print('按键退出')
        break

cv.destroyAllWindows()

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值