系列文章目录
01.csv文件的读写
02.excel文件的读写
前言
本系列用于记录在pandas使用过程中的遇到的各个功能。
本章节记录对于Excel文件的读写。
一、Excel文件的读取与写入
注意:pandas读取Excel文件是调用xlrd进行的,请务必安装xlrd 1.2.0版本!!
- xlrd 1.1.0版本读取xls文件会报错,读取xlsx文件正常
- xlrd 2.0.1版本(目前最新)读取xlsx文件会报错,读取xls文件正常
附安装方式:
pip uninstall xlrd
pip install xlrd==1.2.0
1.read_excel()
read_excel()函数用于读取xls和xlsx文件,输出内容为DataFrame格式。
read_excel()包含许多可配置参数:
def read_excel(
io,
sheet_name=0,
header=0,
names=None,
index_col=None,
usecols=None,
squeeze=False,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skiprows=None,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
parse_dates=False,
date_parser=None,
thousands=None,
comment=None,
skipfooter=0,
convert_float=True,
mangle_dupe_cols=True,
storage_options: StorageOptions = None,):
本章主要介绍read_excel()以下常用参数内容。
1.1 io
可以接收str, bytes, ExcelFile, xlrd.Book, path对象, 以及 file-like对象。这里的str是一个有效的文件路径字符串、path对象可以是pathlib库中提供的Path类也可以是os库中提供的 os.PathLike, file-like对象一般是open函数返回的文件流对象。
import pandas as pd
pd.read_excel("girl.xls")
结果:
这里可以结合pandas的ExcelFile来使用,ExcelFile可以一次将文件中的所有sheet读入到内存中,减少IO次数。并且ExcelFile的实例对象有一个属性sheet_names,可以查看实例中的sheet名列表
excel = pd.ExcelFile("girl.xls")
excel.sheet_names
['Sheet1', 'Sheet2']
结合with使用:
with pd.ExcelFile("girl.xls") as excel:
df = pd