python h5py库的使用

博客介绍了H5数据集的使用,重点讲述了利用h5py的group对GB级数据进行分割的相关内容,聚焦于信息技术领域的数据处理操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

H5数据集的使用

#创建
 with h5py.File("data_train.h5", 'w') as hf:
        hf.create_dataset('train_input', data=shuffled_input)
        hf.create_dataset('train_label', data=shuffled_label)

#打开
with h5py.File("data_train.h5", 'r') as hf:
		train_data = np.array(hf.get('train_input'))
		train_label = np.array(hf.get('train_label'))

使用h5py的 group 分割GB级数据

#创建
with h5py.File("myh5py.h5", "w") as f:
    # 创建两个组
    g1 = f.create_group("bar1")
    g2 = f.create_group("bar2")
    # 分别组里面分别创建名为为train,label的数据集并赋值。
    g1["train"] = np.arange(10)
    g1["label"] = np.arange(10)
    g2["train"] = np.arange(20)
    g2["label"] = np.arange(20)

#打开
with h5py.File("myh5py.h5", "r") as hf:
    for g in hf.keys():#遍历所有的组
        print(np.array(hf.get(g)['train']))#获取组中名为 train 的数据集
        print(np.array(hf.get(g)['label']))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值