要批量合并多个CSV文件,并在合并后的文件中添加标题行,你可以按照以下步骤进行操作:
1. 导入所需的Python库:首先,您需要导入`pandas`库来处理CSV文件。
import pandas as pd
2. 定义文件路径和标题行:指定输入文件夹的路径以及标题行(如果您的每个CSV文件都有相同的列名)。
input_folder = "your_input_folder_path"
output_file = "merged_output.csv"
header = "your_header_row"
3. 创建一个空的DataFrame对象用于存储合并后的数据:
merged_data = pd.DataFrame()
4. 循环遍历文件夹中的CSV文件并进行合并:
import os
for filename in os.listdir(input_folder):
if filename.endswith(".csv"):
file_path = os.path.join(input_folder, filename)
# 跳过第一行,读取CSV文件数据
data = pd.read_csv(file_path, skiprows=1)
# 将数据追加到合并后的DataFrame对象中
merged_data = merged_data.append(data)
# 在合并后的数据中添加标题行
merged_data.columns = header.split(",")
# 将合并后的数据保存为新的CSV文件
merged_data.to_csv(output_file, index=False)
确保替换代码中的`your_input_folder_path`为您实际的输入文件夹路径,`merged_output.csv`为您希望保存合并后文件的名称,以及`your_header_row`为逗号分隔的标题行。
这样,代码将逐个读取文件夹中的CSV文件(跳过第一行),将数据合并到新的DataFrame对象中,并在合并后的数据中添加标题行。最后,将合并后的数据保存为一个新的CSV文件。