Pytorch RuntimeError: inconsistent tensor sizes at /pytorch/torch/lib/TH/generic/THTensorMath.c:2864

gaoprincess

于 2018-05-10 22:01:41 发布

阅读量2.6k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gaoprincess/article/details/80274378

版权

pytorch在得到dataset时没有问题，得到DataLoader时也没有问题，以batch size = 32遍历数据时，出现了：

RuntimeError: inconsistent tensor sizes at /pytorch/torch/lib/TH/generic/THTensorMath.c:2864

调试过程：

1. 将batch size = 1 时，不出现错误。推断有图片跟其他的不一致.

2. 输出open之后的每个img,发现有一个是

<PIL.JpegImagePlugin.JpegImageFile image mode=L size=375x500 at 0x7F3B05F93668>

而其他的都是

<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=375x500 at 0x7F3B05F93668>

model不同。

3. 输出每个图片的size，将batch size 置 1，

看到有几张图片的channel是1( torch.Size([1, 1, 224, 224]))，其他的都是3 (torch.Size([1, 3, 224, 224]))

4. 打算输出图片路径，看这个图片有什么不同：
又一个坑！！！
DataLoader 的参数num_workers大于1时，多线程，这样输出的图片路径和图片可能并不对应，所以根据图片路径看图片的时候，并没有什么不同。
经师兄提醒，将num_workers设为1，得到channel=1的图片的路径，打开看，是黑白图！
到此终于知道原因了！

解决方法：
1. 处理数据时：load 图片，open(image_path), 判断如果是黑白图，则转为RGB，这样channel=3，与其他图片就一致了。

if img.mode == "L": 
    img = img.convert("RGB")

或者

if len(img.getbands())==1: 
    img = img.convert("RGB")

参考链接： https://blog.youkuaiyun.com/icamera0/article/details/50647465

https://blog.youkuaiyun.com/icamera0/article/details/50843172

2. 也可以在 img = open(image_path) 之后修改img

参考链接：

https://github.com/DmitryUlyanov/deep-image-prior/commit/8067fbbae78637e743ce40f362d0bdfdebfcd6ad

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。