本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
a.tofile()和np.fromfile()
a.tofile(frame,sep=’’,format=’%s’)
frame:文件或者字符串;
sep:数据分割字符串,如果是空串,写入文件为二进制;
format:写入文件的格式;
a = np.arange(100).reshape(5,10,2)
a.tofile('b.dat',sep=',',format='%d')

可以看到生成的是由“,”分隔的序列文件,与CSV不同,该文件不包含任何的维度信息,只是将数组中的所有元素逐一列出,并输出到这个文件中,若不指定分隔符,会得到什么样的结果呢?
a = np.arange(100).reshape(5,10,2)
a.tofile('c.dat',format='%.1f')

此时生成的是二进制格式文件,打开后无法使用文本编辑器看懂,事实上,二进制文件会比文本文件占用更少的空间,此时可将二进制文件作为数据备份的一种方式。
如何从文本文件或者二进制文件中还原一个Numpy数组呢?可以

本文总结了numpy的文件操作,包括a.tofile()和np.fromfile()用于生成序列或二进制文件,以及np.save()和np.load()进行便捷的二进制存储与读取。tofile()生成的文件不含维度信息,需要额外存储元数据,而np.save()方法能保存维度和数据类型。在处理大规模数据时,合理选择存储方法至关重要。
最低0.47元/天 解锁文章
4345

被折叠的 条评论
为什么被折叠?



