我们在进行CV方向深度学习工作时,需要基于大量图像进行批量前处理工作。为了便于后期运算,我们通常需要将图片resize成相同的尺寸。
众所周知,图像存在3个维度(hight,wide,RGB通道数)。
通常,我们认为图像的RGB通道数有红绿蓝三个维度,因此图像的第三维度通常为3。
然而,这次处理图像的过程中发现很多jpg格式的图像第三个维度为4,导致resize一直失败,分析原因发现,可能是因为这些图片本来是由png等格式转换成jpg的。
你在玩三种不同格式的图片(至少是那些出现在你问题中的图片)。它们分别是:RGB(尺寸)
(420, 310, 3)),三个通道RGB-A(尺寸)
(420, 310, 4)),四通道
Grayscale(尺寸)
(420, 310)),单通道
第三个维度代表了图像中通道的数量(前两个分别是高度和宽度)。
https://blog.youkuaiyun.com/weixin_42122878/article/details/114913240
为了便于后期将图像resize成相同的尺寸,这里需要进行一个convert操作,判定第三个维度是否为3,如果不是则转换成rgb格式图片,这样转换后的第三个维度就变成了3。
#fname为图像名称
def img2vec(