1. opencv
a. 读取图像:
img = cv.imread(path)
opencv库使用imread读取得到的默认是一个BGR模式的彩色图像,可以使用cv.cvtColor(img, cv.COLOR_BGR2RGB)
将颜色模式转化成RGB。opencv的基本图像类型与numpy数组可以互相转化。因此可以直接调用torch.from_numpy(img)
将图像转成tensor。
b. 保存图像:
cv.imwrite(path, img)
c. 绘制图像:
cv.imshow(name, img)
opencv的绘制图像操作会将图像以窗口的形式显示在屏幕上,因此需要手动执行中断命令来关闭窗口进程。一般会用到:
k = cv.waitKey(0) & 0xFF
if k == 27:
cv.destroyAllWindows()
优点:对图像处理的接口丰富,集成了许多常用的图像处理操作:阈值、边缘检测、角点检测、图像滤波、形态学处理、傅里叶变换、直方图均衡、模板匹配、运动检测(meanshift),并且支持人脸部位识别。
缺陷:opencv在读取图像时,若path错误,仅会返回None,而不会报错,并且opencv不支持使用imread对gif格式的图像进行读取,若要读取gif格式的图像,需要使用gif = cv.VideoCapture(path)
得到一个opencv的视频对象,然后使用ret,frame