1. 读取多个 Excel 文件并合并
假设你有一个文件夹,里面包含多个 Excel 文件,你想将这些文件合并成一个 DataFrame。
import pandas as pd
import os
# 文件夹路径
folder_path = 'path/to/your/excel/files'
# 获取文件夹中的所有 Excel 文件
excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx') or f.endswith('.xls')]
# 创建一个空的 DataFrame 来存储所有数据
all_data = pd.DataFrame()
# 逐个读取每个 Excel 文件并将数据追加到 all_data 中
for file in excel_files:
file_path = os.path.join(folder_path, file)
df = pd.read_excel(file_path)
all_data = pd.concat([all_data, df], ignore_index=True)
# 查看合并后的数据
print(all_data.head())
__
2. 批量处理多个 Excel 文件
假设你需要对多个 Excel 文件进行相同的处理(例如,添加一列、过滤数据等)。
import pandas as pd
import os
# 文件夹路径
folder_path = 'path/to/your/excel/files'
output_folder = 'path/to/output/folder'
# 确保输出文件夹存在
os.makedirs(output_folder, exist_ok=True)
# 获取文件夹中的所有 Excel 文件
excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx') or f.endswith('.xls')]
# 处理每个 Excel 文件
for file in excel_files:
file_path = os.path.join(folder_path, file)
df = pd.read_excel(file_path)
# 添加一列
df['New_Column'] = 'Some Value'
# 过滤数据
filtered_df = df[df['Some_Column'] > 100]
# 保存处理后的数据
output_file_path = os.path.join(output_folder, file)
filtered_df.to_excel(output_file_path, index=False)
print("Processing complete.")
__
3. 从多个 Excel 文件中提取特定信息
假设你需要从多个 Excel 文件中提取特定的信息(例如,某个特定单元格的数据)。
import pandas as pd
import os
# 文件夹路径
fol