python图片第三个维度不是3的情况处理

kunkun_1230

于 2021-10-25 15:49:02 发布

阅读量1.4k

点赞数 2

分类专栏：机器学习可视化文章标签： python 计算机视觉 opencv

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44731100/article/details/120953260

版权

在计算机视觉任务中，遇到jpg图像的第三个维度为4而非标准的3，原因是图片由多通道格式转换而来。解决办法是通过convert操作判断并转换非3通道图像至RGB格式，确保统一的图像维度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们在进行CV方向深度学习工作时，需要基于大量图像进行批量前处理工作。为了便于后期运算，我们通常需要将图片resize成相同的尺寸。

众所周知，图像存在3个维度（hight,wide,RGB通道数）。
通常，我们认为图像的RGB通道数有红绿蓝三个维度，因此图像的第三维度通常为3。

然而，这次处理图像的过程中发现很多jpg格式的图像第三个维度为4，导致resize一直失败，分析原因发现，可能是因为这些图片本来是由png等格式转换成jpg的。

你在玩三种不同格式的图片(至少是那些出现在你问题中的图片)。它们分别是：RGB(尺寸)
(420, 310, 3))，三个通道

RGB-A(尺寸)

(420, 310, 4))，四通道

Grayscale(尺寸)

(420, 310))，单通道

第三个维度代表了图像中通道的数量(前两个分别是高度和宽度)。
https://blog.youkuaiyun.com/weixin_42122878/article/details/114913240

为了便于后期将图像resize成相同的尺寸，这里需要进行一个convert操作，判定第三个维度是否为3，如果不是则转换成rgb格式图片，这样转换后的第三个维度就变成了3。

#fname为图像名称
def img2vec(

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。