Excel是Windows环境下流行而强大的电子表格程序。openpyxl模块可以让Python程序能读取和修改Excel表格文件。例如,你可能有一个无聊的任务,需要从一个表格中复制一些数据,粘贴到另一个表格中。或者可能需要从几千行中挑选出几行,并根据某个条件稍作修改。或者需要查看几百份部门预算电子表格,找到其中的赤字。这些无聊的任务都可以用Python完成。
Excel文档
一个Excel电子表格文件称为一个工作簿。一个工作簿保存在扩展名为.xlsx的文件中。每个工作簿可以包含多个表(也称为工作表)。用户当前查看的表(或关闭Excel前最后查看的表)称为活动表。每个表都有一些列(地址是从A开始的字母)和一些行(地址是从1开始的数字)。在特定行和列的翻个称为单元格。每个单元格都包含一个数字或文本值。单元格形成的网格和数据构成了表。
安装openpyxl模块
Python没有自带openpyxl,所以必须自己安装。打开命令行输入
pip install openpyxl
即可安装。
读取Excel文档
我们将使用名为example.xlsx的电子表格,可以在Automate the Boring Stuff with Python处找到并下载。如下图所示,有3个默认的表,名为Sheet1、Sheet2和Sheet3,这是Excel自动为新工作簿提供的(不同操作系统和电子表格程序,提供的默认表个数可能会不同)。
用openpyxl模块打开Excel文档
导入openpyxl模块后,就可以用openpyxl.load_workbook()
函数打开Excel文档。
openpyxl.load_workbook()
函数接受文件名,返回一个workbook数据类型的值。这个workbook对象代表整个Excel文件(example.xlsx),类似File对象代表一个打开的文本文件。