pandas保存读取的文件

最新推荐文章于 2024-09-24 12:25:44 发布

原创最新推荐文章于 2024-09-24 12:25:44 发布 · 639 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#pandas

如果你已经成功读取了XLS文件并将其保存到一个DataFrame中，并且希望将处理后的数据保存到新的文件中，可以使用pandas提供的多种文件格式保存功能。以下是一些常见的文件格式及其保存方法：

保存为CSV文件

CSV（Comma-Separated Values）是一种常见的文本文件格式，适用于大多数数据处理工具。

# 保存为CSV文件
df.to_csv('path/to/your/output.csv', index=False)

保存为Excel文件

如果你希望保存为Excel文件（XLS或XLSX），可以使用以下方法：

# 保存为XLSX文件
df.to_excel('path/to/your/output.xlsx', index=False)

# 保存为XLS文件（需要安装`xlwt`库）
df.to_excel('path/to/your/output.xls', index=False)

保存为JSON文件

JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，适用于Web应用和API。

# 保存为JSON文件
df.to_json('path/to/your/output.json', orient='records')

保存为Parquet文件

Parquet是一种高效的列式存储格式，适用于大数据处理。

# 保存为Parquet文件（需要安装`pyarrow`库）
df.to_parquet('path/to/your/output.parquet', index=False)

示例代码

以下是一个完整的示例代码，展示如何读取XLS文件并将其保存为不同的文件格式：

import pandas as pd

# 指定文件路径
file_path = 'path/to/your/file.xls'

# 读取XLS文件
df = pd.read_excel(file_path)

# 打印数据框的前几行，以确认读取正确
print(df.head())

# 保存为CSV文件
df.to_csv('path/to/your/output.csv', index=False)

# 保存为Excel文件（XLSX）
df.to_excel('path/to/your/output.xlsx', index=False)

# 保存为JSON文件
df.to_json('path/to/your/output.json', orient='records')

# 保存为Parquet文件（需要安装`pyarrow`库）
df.to_parquet('path/to/your/output.parquet', index=False)