python3__pandas__文件读写

本文介绍Pandas这一高效的数据分析工具,涵盖其核心特点及多种文件读取方式,如CSV、Excel等,并通过实例展示了不同读取函数的使用方法。

1.pandas:强大的数据分析与处理工具

  1. 快速、灵活、富有表现力的数据机构(Series系列DataFrame数据框
  2. 支持类似于SQL的数据增删改查
  3. 丰富的数据处理函数
  4. 支持时间序列分析功能
  5. 支持灵活处理缺失值

2.读文件函数

函数名称说明
read_table读取csv文件,默认分隔符号“\t”
read_csv读取csv文件,默认分割符号“,”
read_excel读取excel文件
read_hdf读取hdf文件(HDF用于存储和分发科学数据的一种自我描述、多对象文件格式)
read_sql 
read_json 
read_msgpack(experimental) 
read_html 
read_gbq(experimental) 
read_clipboard

 

 

 

 

 

 

 

 

 

 

 

 

 

代码展示:

# ----------------------------------read_table-------------------------------------
# --常用参数
# --filepath_or_buffer:文件地址
# --seq="\t":默认是tab分割的数据,如果是其他分隔符可以进行更改
# --header='infer':默认会自动推断文件头,如果设置为None则无文件头,为1则第一行为文件头
# --engine=None: 默认是C引擎解析,如果使用python引擎,可以解析更丰富的内容。('python')
# --encoding: 表示在读文件时采用的编码格式
data1 = pd.read_table("3.1_data.txt", sep=",", header=1, engine="python", encoding="utf-8")
print(data1)

# ----------------------------------read_csv---------------------------------------
# --同上
# --与read_table的不同之处是:默认的分隔符为seq=','

# ----------------------------------read_excel-------------------------------------
# --常用参数
# --io: 文件路径
# --sheet_name:返回多表使用sheetname=[0,1],若sheetname=None是返回全表 注意:int/string 返回的是dataframe,而none和list返回的是dict of dataframe
# --header: 指定列名行,数据为列名行一下内容,默认为None
# --skiprows:从上往下,省略指定行数的数据
# --skipfooter:从下往上,省略指定行数的数据
# --names:指定列的名字
# --index_col: 指定某一列为索引列,可以赋值为string
data2 = pd.read_excel(io="myXls.xls",  sheet_name="Sheet2", header=None, skiprows=3, skipfooter=1, names=["A", "B", "C"])
print(data2)

# ----------------------------------read_hdf---------------------------------------
# --def read_hdf(path_or_buf, key=None, mode='r', **kwargs)
# --常用参数
# --path_or_buf:文件路径
# --key:商店中的组标识符
# --mode: 打开文件的模式
# --start: 开始的行号(包括)
# --stop: 停止的行号(不包括)
data3 = pd.DataFrame([[1, 1.0, 'a'], [2, 2.2, 2.3], [3.4, 3.5, 3.6]], columns=["x", "y", "z"])
data3.to_hdf("store.h5", "data")
reread = pd.read_hdf(path_or_buf="store.h5", key=None, mode="r", start=0, stop=3)
print(reread)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

博士僧小星

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值