python图片第三个维度不是3的情况处理

在计算机视觉任务中,遇到jpg图像的第三个维度为4而非标准的3,原因是图片由多通道格式转换而来。解决办法是通过convert操作判断并转换非3通道图像至RGB格式,确保统一的图像维度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我们在进行CV方向深度学习工作时,需要基于大量图像进行批量前处理工作。为了便于后期运算,我们通常需要将图片resize成相同的尺寸。

众所周知,图像存在3个维度(hight,wide,RGB通道数)。
通常,我们认为图像的RGB通道数有红绿蓝三个维度,因此图像的第三维度通常为3。

然而,这次处理图像的过程中发现很多jpg格式的图像第三个维度为4,导致resize一直失败,分析原因发现,可能是因为这些图片本来是由png等格式转换成jpg的。

你在玩三种不同格式的图片(至少是那些出现在你问题中的图片)。它们分别是:RGB(尺寸)
(420, 310, 3)),三个通道

RGB-A(尺寸)

(420, 310, 4)),四通道

Grayscale(尺寸)

(420, 310)),单通道

第三个维度代表了图像中通道的数量(前两个分别是高度和宽度)。
https://blog.youkuaiyun.com/weixin_42122878/article/details/114913240

为了便于后期将图像resize成相同的尺寸,这里需要进行一个convert操作,判定第三个维度是否为3,如果不是则转换成rgb格式图片,这样转换后的第三个维度就变成了3。

#fname为图像名称
def img2vec(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值