在 Python 中,处理 Excel 文件通常使用以下库:
openpyxl
:支持读取和写入 Excel 2007+(.xlsx
)文件。pandas
:结合强大的数据处理能力,适合读取和操作 Excel 文件。xlrd
/xlwt
:支持旧版 Excel(.xls
),但已逐渐被替代。
以下是使用 openpyxl
和 pandas
操作 Excel 的详细教程。
1. 使用 openpyxl
处理 Excel
openpyxl
是一个强大的库,支持读写 .xlsx
格式的 Excel 文件。
读取 Excel 文件
from openpyxl import load_workbook
# 加载 Excel 文件
workbook = load_workbook("example.xlsx")
# 获取所有工作表名称
print(workbook.sheetnames)
# 选择一个工作表
sheet = workbook["Sheet1"]
# 读取单元格的值
print(sheet["A1"].value) # 读取 A1 单元格
print(sheet.cell(row=2, column=1).value) # 使用行列坐标读取
写入 Excel 文件
from openpyxl import Workbook
# 创建一个新的 Excel 文件
workbook = Workbook()
# 获取默认工作表
sheet = workbook.active
sheet.title = "Sheet1"
# 写入数据到单元格
sheet["A1"] = "Name"
sheet["B1"] = "Age"
sheet["A2"] = "Alice"
sheet["B2"] = 30
# 保存文件
workbook.save("output.xlsx")
2. 使用 pandas
处理 Excel
pandas
是用于数据分析的强大库,支持高效地读取和写入 Excel 文件。
读取 Excel 文件
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel("example.xlsx", sheet_name="Sheet1")
print(df)
# 访问特定列或行
print(df["Name"]) # 访问列
print(df.iloc[0]) # 访问第一行
写入 Excel 文件
import pandas as pd
# 创建一个 DataFrame
data = {
"Name": ["Alice", "Bob", "Charlie"],
"Age": [30, 25, 35]
}
df = pd.DataFrame(data)
# 写入到 Excel 文件
df.to_excel("output.xlsx", index=False)
3. 处理多个工作表
使用 openpyxl
from openpyxl import Workbook
# 创建工作簿
workbook = Workbook()
# 添加工作表并写入数据
sheet1 = workbook.active
sheet1.title = "Sheet1"
sheet1["A1"] = "Hello from Sheet1"
sheet2 = workbook.create_sheet(title="Sheet2")
sheet2["A1"] = "Hello from Sheet2"
# 保存文件
workbook.save("multi_sheets.xlsx")
使用 pandas
import pandas as pd
# 创建多个 DataFrame
data1 = {"Name": ["Alice", "Bob"], "Age": [30, 25]}
data2 = {"Product": ["Apple", "Banana"], "Price": [3, 2]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 写入多个工作表
with pd.ExcelWriter("multi_sheets.xlsx") as writer:
df1.to_excel(writer, sheet_name="Sheet1", index=False)
df2.to_excel(writer, sheet_name="Sheet2", index=False)
4. 追加数据到现有 Excel 文件
使用 openpyxl
可以追加数据到现有的 Excel 文件。
from openpyxl import load_workbook
# 加载现有 Excel 文件
workbook = load_workbook("output.xlsx")
sheet = workbook.active
# 在最后一行追加数据
sheet.append(["New Name", 40])
# 保存文件
workbook.save("output.xlsx")
5. 处理 Excel 文件中的公式
openpyxl
支持处理 Excel 的公式。
写入公式
from openpyxl import Workbook
# 创建工作簿
workbook = Workbook()
sheet = workbook.active
# 写入公式
sheet["A1"] = 10
sheet["B1"] = 20
sheet["C1"] = "=SUM(A1:B1)" # 写入求和公式
# 保存文件
workbook.save("formula.xlsx")
6. 使用 xlrd
/ xlwt
(仅用于旧版 Excel 文件)
如果需要处理 .xls
格式的文件,可以使用这些库。但它们已经逐步被弃用,建议使用 openpyxl
或 pandas
。
小结
openpyxl
:强大、灵活,支持读写.xlsx
文件,包括公式和格式。pandas
:适合数据处理和分析,能够高效操作 Excel 文件。xlrd
/xlwt
:处理.xls
文件,但已过时。