在pytorch中对于图片的读取有两种办法:Image.open()和vc2.imread()
两者读取的图片的格式不同:Image读取的图片是“RGB”,Opencv读取的图片是“BGR”
尺寸也不同:Image读取的图片是[W,H],Opencv读取的图片是[H,C,W]
那么问题来了,在Pytorch中的图片必须转为Tensor类型才可以使用,那么怎么把PIL类型转为Tensor类型呢?
可以使用预处理,也就是transform进行处理:例如:
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Resize((32,32)),
transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))
])
就可以将Image的[W,H]图转为Tensor的[C,H,W]图,另外对于tensor的图片通常要传入的格式是[N,C,H,W]格式,所以需要对转换为[C,H,W]的图片再进行升维,采用unsqueeze(x,dim=0)
tips:降维:x.squeeze(dim=a),dim=a在指定位置,去掉维度为1的和升维,x.unsqueeze(dim=a),dim=a在指定位置,加上维数为1的维度