pytorch在得到dataset时没有问题,得到DataLoader时也没有问题,以batch size = 32遍历数据时,出现了:
RuntimeError: inconsistent tensor sizes at /pytorch/torch/lib/TH/generic/THTensorMath.c:2864
调试过程:
1. 将batch size = 1 时,不出现错误。推断有图片跟其他的不一致.
2. 输出open之后的每个img,发现有一个是
<PIL.JpegImagePlugin.JpegImageFile image mode=L size=375x500 at 0x7F3B05F93668>
而其他的都是
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=375x500 at 0x7F3B05F93668>
model不同。3. 输出每个图片的size,将batch size 置 1,
看到有几张图片的channel是1( torch.Size([1, 1, 224, 224])),其他的都是3 (torch.Size([1, 3, 224, 224]))
4. 打算输出图片路径,看这个图片有什么不同:
又一个坑!!!
DataLoader 的参数num_workers大于1时, 多线程,这样输出的图片路径和图片可能并不对应,所以根据图片路径看图片的时候,并没有什么不同。
经师兄提醒,将num_workers设为1,得到channel=1的图片的路径,打开看,是黑白图!
到此终于知道原因了!
解决方法:
1. 处理数据时:load 图片,open(image_path), 判断如果是黑白图,则转为RGB,这样channel=3,与其他图片就一致了。
if img.mode == "L":
img = img.convert("RGB")
或者
if len(img.getbands())==1:
img = img.convert("RGB")
参考链接: https://blog.youkuaiyun.com/icamera0/article/details/50647465
https://blog.youkuaiyun.com/icamera0/article/details/50843172
2. 也可以在 img = open(image_path) 之后修改img
参考链接:
https://github.com/DmitryUlyanov/deep-image-prior/commit/8067fbbae78637e743ce40f362d0bdfdebfcd6ad