读写文本格式的数据
读取数据
函数 | 说明 |
---|---|
read_csv | 从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为, |
read_table | 从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为\t |
read_fwf | 读取定宽列格式数据(也就是说,没有分隔符) |
read_clipboard | 读取剪贴板的数据 |
read_excel | 从excel中读取数据 |
read_hdf | 从hdf中读取数据 |
写入数据
函数 | 说明 |
---|---|
to_csv | 将数据写成csv格式 |
to_excel | 将数据写成excel格式 |
to_hdf | 将数据写成hdf格式 |
read_csv/read_table函数的参数
参数 | 说明 |
---|---|
path | 文件的路径 |
sep | 用于对行中各字段进行拆分的字符序列或正则表达式 |
header | 用作列名的行号,默认为0(第一行),如果没有header行就应该设置为None |
index_col | 用作行索引的列编号或列名 |
name | 用于结果的列名列表,结合header=None |
nrows | 需要读取的行数(从文件开始处算起) |
skiprows | 需要忽略的行数(从文件开始处算起),或需要跳过的行号列表(从0开始) |
skipfooter | 需要忽略的行数(从文件末尾算起) |
na_values | 一组用于替换NA的值 |
iterator | 返回一个TextParser以便逐块读取文件 |
chunksize | 文件块的大小(用于迭代) |
JSON数据
函数 | 说明 |
---|---|
json.loads | 将JSON字符串转换成python格式 |
json.dumps | 将python对象转换成JSON格式 |
二进制数据格式
函数 | 说明 |
---|---|
save | 将数据以pickle形式保存到磁盘上 |
load | 读取pickle形式的数据 |
转载地址:
《利用Python进行数据分析》