Python 操作 Excel 数据表:数据读取
用 Python 操作 Excel 数据表
Excel 由于其直观的界面、出色的计算功能和图表工具,目前已经成为最流行的个人计算机数据处理软件,在日常办公中必不可少。而借助于 Python 可以让用户更加高效的使用 Excel,减少重复性的工作,我们之前也说过,Python 拥有大量的第三方库可以帮助我们完成丰富的场景,现在我们将学习用来操作 Excel 的第三方库:xlrd。
xlrd 模块
xlrd 是一个用于从 Excel 文件(.xls/.xlsx)读取数据和格式化信息的库。在内容正式开始前,建议先回顾下 Excel 文件中的一些名词概念,即工作簿、工作表、行、列、单元格,如下图所示。
1.1 安装
xlrd 是 Python 的第三方库,使用前需要通过以下命令进行安装:
pip install xlrd==1.2.0
(注意:高版本的xlrd有可能不兼容,所以需要指定低版本)
1.2 使用步骤
步骤 1:导入 xlrd 模块
import xlrd
通过 import xlrd 完成导入。
步骤 2:加载 Excel 文件
import xlrd
filename=r’D:\lx\test.xlsx’ #记得用r转换
data=xlrd.open_workbook(filename)
open_workboox () 方法返回当前工作簿的一个实例,后续的操作都是通过这个实例进行。
步骤 3:读取数据
拿到 Excel 的实例后,即可通过 xlrd 模块提供的方法进行数据的读取。
2. xlrd 模块使用
这部分内容我们将针对 Excel 中常用概念:工作表、列、行、单元格,依次对应介绍 xlrd 模块的操作方法。接下来的所有操作都将围绕工作簿 test.xlsx 进行,test.xlsx 中包括 3 个工作表(sheet),每个工作表内容如下图所示:
2.1 xlrd 操作 Excel 工作表
在一个工作簿中可以定义多个工作表(sheet),而数据真正所存放的位置正是在工作表中,所以在开始读取数据前,首先需要对工作表进行操作,常用属性,见下表:
属性 | 描述 |
---|---|
nsheets | 获取工作簿中sheet的数量 |
import xlrd
filename=r’D:\lx\test.xlsx’
data=xlrd.open_workbook(filename)
print(data.nsheets) #有3个sheet页,所以输出3
通过上述代码,可以得知在 data.xlsx 文件中,共有 3 个工作表(sheet)。xlrd 操作工作表(sheet)常用方法,见下表。
方法 | 描述 |
---|---|
sheets() | 获取所有 sheet 的对象,以列表形式显示 |
sheet_by_index(sheetx ) | 根据索引返回对应的 sheet |
sheet_by_name(sheet_name ) | 通过 sheet 名称返回对应 sheet |
sheet_names() | 返回工作簿中所有 sheet 名称 |
sheet_loaded(sheet_name_or_index ) | 通过 sheet 名称或索引判断该 sheet 是否导入成功,返回值为 bool 类型,True 表示已导入,False 表示未导入 |
unload_sheet(sheet_name_or_index ) |