1. 读/写图像文件
OpenCV的imread函数()和imwrite函数()都可以支持各种静态文件格式。无论哪种格式,每个像素都有一个值,但不同格式表示像素的方式又有所不同。
利用二维numpy数组创建的简单图像和利用cv2.cvColor函数将该图像转换成BGR(Blue-green-red)格式,通过shape属性来查看图像的结构。
numpy创建的数组属性返回为(3,3),而转为BGR格式则返回(3,3,3),这表明每个像素存在三个通道。
也可以通过读取一种格式的图像文件,然后将其保存为另一种格式,如下图:
在默认的情况下,即使是灰度图像imread()函数也会返回BGR格式的图像,BGR和RGB所表的色彩空间相同,但是字节顺序相反。
以下选项可作为imread()函数的参数:
****IMREAD_ANYCOLOR = 4
****MREAD_ANYDEPTH = 2
****IMREAD_COLOR = 1
****IMREAD_GRAYSCALE = 0
****IMREAD_LOAD_GOAL = 8
****IMREAD_UNCHANGED = -1
下图则将加载的png文件作为灰度图像,然后又将其保存为灰度的png图像:
无论采用哪种模式,imread()函数会删除所有alpha通道的信息(透明度)。imwrite()函数要求图像为BGR或灰度格式,并且每个通道要有一定的位(bit),输出格式要支持这些通道。例如,bmp格式要求每个通道有8位,而PNG允许每个通道有8位或16位。
2.图像与原始字节之间的转换
一个OpenCV图像是.array类型的二维或者三维数组。一个24位的BGR图像是一个三维数组,可使用表达式访问这些值,例如image[0,0,0],第一个值表示y或者行,第二个值表示x或者列,第三个值表示颜色通道。
还有另一种表达式,如image[0,0]或image[0,0]=128可表示为image.item((0,0))或image.setitem((0,0),128)。对于单像素操作第二种表示方式更为有效。
使用 Python标准的os.random()函数可随机生成原始字节,随后会把该字节转换为 NumPy数组。需要注意的是,诸如 numpy.random.randint(O,256,120000 reshape(300,400)语句也能直接(并且更高效地)随机生成 NumPy数组。使用 os.randon函数的唯一理由是该语句有助于展示原始字节的转换。
3. 使用numpy.array访问图像数据
#coding:utf-8
import cv2
import numpy as np
img = cv2.imread("D:\Algorithm\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Chapter 3_Code\gg.jpeg")
# 使用循环来处理Pyhton数组的效率较低,使用数组索引能够高效的操作像素尤其对于视频数据来讲
img[:,:,1] = 0
# 上面的那一行代码可获得 所有行和列的全部像素,并将其所有的G(绿色)设置为0
# 若显示此图像,则会发现无绿色
import cv2
import numpy as np
img= cv2.imread("D:\Algorithm\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Chapter 3_Code\gg.jpeg")
my_roi=img[0:100,0:100]
img[300:400,300:400]= my_roi #通过numpy将某一区域与变量绑定,并将该区域的值分配到其他区域
4. 在窗口显示图像
#coding:utf-8
import cv2
import numpy as np
## 图像位置尽量选择绝对位置
img = cv2.imread("D:\Algorithm\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Chapter 3_Code\gg.jpeg")
cv2.imshow('my image', img)
cv2.waitKey() #窗口显示帧
cv2.destroyAllWindows()
利用OpenCV的imshow()函数来实现图像的显示。imshow()函数有两个参数:
第一个参数是显示图像的名称。
** 如果图片放在当前文件夹下,直接写文件名就行了,如’gg.jpeg’。
** 否则,需要给出绝对路径,如"D:\Algorithm\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Learning_OpenCV_3_Computer_Vision_with_Python_Second_Edition_Code\Chapter 3_Code\gg.jpeg"
第二个参数是图像的读取方式。
** cv2.IMREAD_COLOR:彩色图,默认值(1)
** cv2.IMREAD_GRAYSCALE:灰度图(0)
** cv2.IMREAD_UNCHANGED:包含透明通道的彩色图(-1)
最后调用 destroyAllwindows()函数可以释放由 OpenCV创建的所有窗口。
5. 在窗口显示摄像头帧
OpenCV的 namedWindow()、 imshow()和 Destroy Window()函数允许指定窗口名来创建、显示和销毁( destroy)窗口。此外,任意窗口下都可以通过 waitKeyo函数来获取键盘输人,通过 setMouseCallback()函数来获取鼠标输入。
#coding:utf-8
import cv2
clicked = False
def onMouse(event, x, y, flags, param):
global clicked
if event == cv2.EVENT_LBUTTONUP:
clicked == True
cameraCapture = cv2.VideoCapture(0)
cv2.namedWindow('MyWindow')
cv2.setMouseCallback('MyWindow', onMouse)
print 'Showing camera feed. Click window or press any key to stop.'
success, frame = cameraCapture.read()
while success and cv2.waitKey(1) == -1 and not clicked:
cv2.imshow('MyWindow', frame)
success, frame = cameraCapture.read()
cv2.destroyAllWindows('MyWindow')
cameraCapture.release()
waitKey()的参数为等待键盘触发的时间,单位为毫秒,时间一到,会继续执行接下来的程序,传入0的话表示一直等待,如cv2.waitKey(0)。
OpenCV的窗口函数和 waitKey()函数相互依赖。 OpenCV的窗口只有在调用 waitKey()函数时才会更新, waitKey函数只有在 OpenCV窗口成为活动窗口时,才能捕获输入信息。
6.视频文件的读/写
OpenCV提供的VideoCapture类和VideoWriter类支持各种格式的视频文件。
在到达视频文件末尾之前,可以通过VideoCapture类的read()函数来获取新的帧,每一帧是基于BGR格式的图像。
可将一幅图像传递给VideoWriter类的write()函数,该函数会将这幅图像加到VideoWriter类指向的文件中。
#coding:utf-8
import cv2
videoCapture = cv2.VideoCapture('MyInputVideo.avi') #使用绝对路径
fps = videoCapture.get(cv2.CAP_PROP_FPS)
size = (int(videoCapture.get(cv2.CAP_PROP_FRAME_WIDTH)),int(videoCapture.get(cv2.CAP_PROP_FRAME_HEIGHT)))
videoWriter = cv2.VideoWriter('MyOutputVedio.avi', cv2.VideoWriter_fourcc('I', '4', '2', '0'), fps, size) # 版本为OpenCV 3.0.0,MyOutputVedio.avi使用绝对路径
success, frame = videoCapture.read()
while success:
VideoWriter.write(frame)
success, frame = videoCapture.read()
必须要为 Video writer类的构造函数指定视频文件名,这个文件名对应的文件若存在,会被覆盖。也必须指定视频编解码器,编解码器的可用性根据系统不同而不同。
帧速率和帧大小也必须要指定,因为需要从另一个视频文件复制视频帧,这些属性可以通过 Video Capture类的get()函数得到。