今天想利用实验室的服务器跑一个程序,因为程序中需要读取分析的数据量太大,所以昨天晚上在本机上将程序调试好了之后,本以为只需要今天传到服务器熵运行一下就可以了,却没有想到因为一个小问题折腾了一天。
问题描述:将numpy中的ndarry数据变成torch中的tensor,然后再转回numpy,数据发生改变!
a = numpy数组
b = torch.Tensor(a)
c = b.numpy()
程序结果:a!=c
原因:numpy中的int数据类型是int8,也就是占据8个位,但是转成tensor之后,tensor中的int是int16,占据16个位,再加上在服务器上的数据是随机存储的(本机上存储数据的模式与服务器上不同,这一点是听大神说的,自己并不是很懂),就会导致数据发生改变。
修改:
a = numpy数组
b = torch.Tensor(a.astype(‘int16’))
c = b.numpy()
程序结果:a=c
真是个大坑啊,要不是和别人请教,估计我一年也找不出来这个错误。
服务器与本机运行时的差别(记因数据存储位数的不同荒废的一天)
