python利用numpy存取文件

 NumPy提供了多种存取数组内容的文件操作函数。保存数组数据的文件可以是二进制格式或者文本格式。二进制格式的文件又分为NumPy专用的格式化二进制类型和无格式类型。

numpy格式的文件可以保存为后缀为(.npy/.npz)格式的文件

1. tofile()和fromfile()

tofile()将数组中的数据以二进制格式写进文件
tofile()输出的数据不保存数组形状和元素类型等信息
fromfile()函数读回数据时需要用户指定元素类型,并对数组的形状进行适当的修改
import numpy as np
 
# 随机生成12个数字并将其有一维转换成3*4的矩阵形式
a = np.arange(12)
print("一维数组:",a)
a.shape = 3,4
print("3*4的矩阵:",a)
 
# 将数组中的数据以二进制格式写入到文件
a.tofile('a.bin')
# fromfile在读取numpy文件时需要自己指定数据格式,并且原格式并为保存
b1 = np.fromfile('a.bin', dtype=np.float) # 按照float读取数据
b2 = np.fromfile('a.bin', dtype=np.int) # 按照int读取数据
b3 = np.fromfile('a.bin', dtype=np.int32) # 按照int32读取数据
print('float格式b1:{},\nint格式b2:{},\nint32格式b3:{}'.format(b1,b2,b3))
 
b3.shape = 3,4
print('b3:',b3)


 

2. save() 和 load(),savez()

NumPy专用的二进制格式保存数据,它们会自动处理元素类型和形状等信息
如果想将多个数组保存到一个文件中,可以使用savez()
savez()的第一个参数是文件名,其后的参数都是需要保存的数组,也可以使用关键字参数为数组起名
非关键字参数传递的数组会自动起名为arr_0、arr_1、...。
savez()输出的是一个扩展名为npz的压缩文件,其中每个文件都是一个save()保存的npy文件,文件名和数组名相同
load()自动识别npz文件,并且返回一个类似于字典的对象,可以通过数组名作为键获取数组的内容
import numpy as np
 
a = np.arange(12)
a.shape = 3,4
# 将数据存储为npy/npz
np.save('a.npy', a)
np.save('a.npz', a)
c = np.load('a.npy')
print('save-load:',c)
 
# 存储多个数组
b1 = np.array([[6, 66, 666],[888, 88,8]])
b2 = np.arange(0, 1.0, 0.1)
c2 = np.sin(b2)
np.savez('result.npz', b1,b2,sin_arry = c)
c3 = np.load('result.npz') # npz文件时一个压缩文件
print(c3)
print("数组b1:{}\n数组b2:{}\n数组sin_arry:{}".format(c3['arr_0'],c3['arr_1'],c3['sin_arry']))
 

3. savetxt() 和 loadtxt()

读写1维和2维数组的文本文件
可以用它们读写CSV格式的文本文件
 

用这种方式来对数据进行存储,方便深度学习中, 保存了训练集,验证集,测试集,还包括他们的标签,用这个方式存储起来,要啥加载啥,文件数量大大减少,也不会到处改文件名。算是get到了另外一种好的存储数据的方式

参考:https://www.cnblogs.com/wushaogui/p/9142019.html

https://www.cnblogs.com/dmir/p/5009075.html

 
————————————————
版权声明:本文为优快云博主「疯子!!!」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.youkuaiyun.com/weixin_39121325/article/details/85781878

NumPy是一个强大的Python库,主要用于科学计算。它提供了一个高性能的多维数组对象ndarray以及用于操作这些数组的工具。下面我们将详细介绍如何使用NumPy进行数据存取。 ### 使用`numpy.save`保存单个数组到文件 ```python import numpy as np # 创建一个示例数组 data = np.array([[1, 2], [3, 4]]) # 将数组保存为 .npy 文件 np.save('example.npy', data) ``` 通过以上代码片段可以看到我们创建了一组简单的二维数组,并将其保存成了名为 `example.npy` 的二进制文件。这种格式非常适合快速读写大型数值型数据集并且保持良好的性能特点。 ### 加载已存储的数据 当需要从 `.npy` 文件加载之前保存过的 NumPy 数组时可以这样做: ```python loaded_data = np.load('example.npy') print(loaded_data) # 输出应显示相同的矩阵 [[1 2] # [3 4]] ``` 如果想要将多个数组一起打包成一个`.npz`压缩包的形式,则可通过以下方式进行处理: #### 存储多个数组至单一归档文件(.npz) ```python a = np.arange(5) b = np.linspace(0., 2.*np.pi, 6) # 把两个数组作为关键字参数传入,键名即为它们将在档案中的名称。 np.savez("arrays.npz", a=a, b=b) ``` 此时会生成一个新的压缩文件叫做"arrays.npz". 为了恢复这个压缩文档里的所有内容你需要做的是这样的: ```python archive = np.load('arrays.npz') for key in archive.files: print(f"{key}: {archive[key]}") ``` 除了上述提到的方式外,还可以直接利用文本形式来进行简单的小规模数字列表交换如 CSV 或者 TSV 等常用表格结构化信息载体也都是可行的选择之一。 对于文本文件(例如CSV),你可以选择使用`genfromtxt()`或`loadtxt()`, 它们都能很好地应对这类任务需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值