import pandas as pd
from pandasql import sqldf
# 读取employee.xlsx和department.xlsx到Pandas数据框
employee_df = pd.read_excel("employee.xlsx")
department_df = pd.read_excel("department.xlsx")
# 在Pandasql中使用JOIN操作
query = """
SELECT e.*, d.name as department_name
FROM employee_df e
JOIN department_df d ON e.department_id = d.id
"""
result = sqldf(query, locals())
# 结果写到一个新的表
result.to_excel("result.xlsx", index=False)
如果直接pip下不下来的话
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandasql
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple openpyxl
PythonPandasSQLJoin操作处理Excel数据
该文章展示了如何使用Python的pandas库和pandasql模块对Excel文件进行数据处理。首先,它导入了pandas和pandasql,并读取了employee.xlsx和department.xlsx文件到数据框。接着,执行了一个SQLJOIN操作来合并两个数据框,基于e.department_id等于d.id的条件。结果被保存到新的result.xlsx文件中。
1388

被折叠的 条评论
为什么被折叠?



