今天要说的事情很简单,就是比较了一下 PIL 和 cv2 resize 图片的速度。我们都知道,Python 中有关图像处理的库有很多,常见的有 cv2,scikit-image,PIL (严谨点应该叫 Pillow,下文就用 PIL 来代替了) 等等。在用 Python 进行深度学习图像任务的时候,我们常常会使用 PIL 这个库来读取图片(尤其是在用 PyTorch 的时候)。至于为什么 PIL 比较常用,我也不知道… 难道是 TorchVision 带来的风气(https://github.com/pytorch/vision#image-backend)? 但在进行视频流处理的时候,我们往往会用到 cv2,因为都会用到 cv2.VideoCapture() 来读视频(应该没有人第一反应是其他的库吧)。
为什么会想到对比这二者 resize 图片的速度?原因是最近处理视频流的时候用的是 cv2 读取,每一帧读出来的结果是一个3维的 Numpy Array
。然后要 resize 一下送到模型嘛,因为惯性我就用了 PIL 来做图片 resize (而没有用 cv2.resize)。PIL 的 resize 只能对 PIL Image
类做处理,所以我先把 Numpy Array
转成 PIL Image
, 然后 resize, 然后再转回 Numpy Array
。 我后来再看代码的时候心想这 tm 是什么操作?那索性来比一比这二者的速度吧。
因为这不是什么严肃的对比,所以我就不列啥硬件软件配置了。但大体上就是,一台普通的电脑,用着 pip3 安装来的普通的 cv2 和 PIL,做的一次简单的对比。
resize 对比
对比中我们使用的是 CV 界中的经典图像,512x512 的豪华彩色三通道 Lena 的 png 图片, 你看看这高清的像素,你看看这左上角标的 2014 的独特 logo,你看看这被截到只剩下头和肩膀的 Lena :
首先我们先测试一下 cv2 的速度,我们采用双线性插值,将 512x512 的图片 resize 到 1024x1024:
repeat = 2000
im = cv2.imread('lena512_colour.png')
print(type(im), im.shape)
# <class 'numpy.ndarray'> (512, 512, 3)
start = time.time()
for i in range(repeat):
im_resized = cv2.resize(im, (1024, 1024), interpolation