12、pandas数据读写与操作全解析

pandas数据读写与操作全解析

1. HDF5格式数据处理

在数据分析涉及大量数据时,使用二进制格式更为合适,HDF5库在处理二进制数据方面表现出色。HDF是分层数据格式的缩写,该库用于读写包含节点结构和存储多个数据集的HDF5文件。它用C语言开发,同时提供了与Python、Matlab和Java等语言的接口,使用广泛且效率高,能实时压缩数据。

在Python中处理HDF5有两种选择:PyTables和h5py。h5py提供与HDF5高级API的直接接口,而PyTables则抽象了HDF5的许多细节,提供更灵活的数据容器、索引表、查询功能等。

pandas有一个类似字典的类HDFStore,使用PyTables来存储pandas对象。使用前需导入该类:

from pandas.io.pytables import HDFStore

下面是存储DataFrame数据到HDF5文件的示例:

import pandas as pd
import numpy as np

frame = pd.DataFrame(np.arange(16).reshape(4,4),
                     index=['white','black','red','blue'],
                     columns=['up','down','right','left'])
store = HDFStore('mydata.h5')
store['obj1'] 
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值