pandas读取csv文件的操作

最新推荐文章于 2025-06-25 00:03:24 发布

原创最新推荐文章于 2025-06-25 00:03:24 发布 · 9.5w 阅读

78 ·

CC 4.0 BY-SA版权

本文详细介绍了使用Python的pandas库进行CSV文件的读取和写入操作，包括读取整个文件、指定列数据，以及如何保存数据并自定义保存格式。通过实例展示了如何设置行索引为日期格式，以及在保存文件时如何控制是否包含列索引和行索引。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 读取csv文件

import pandas as pd
import numpy as np

# 读取整个csv文件
csv_data = pd.read_csv("./stock_day.csv")

# 读取指定列索引字段的数据
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])

# 将我们修改完的csv的文件保存到新的路径下
csv_data.to_csv('demo.csv')

观察我们保存的文件的格式(行索引为我们的日期, 列索引为 open close) :

# 查看新保存的文件
new_data = read_csv('./demo.csv')

观察新保存的文件(我们在读取的时候默认给我们添加了新的行索引, 及Unnamed:0):

使用to_csv的时候, 我们可以给他传入几个参数:

csv_data.to_csv('demo.csv', header=True, index=False)

to_csv这个方法中可以传递一些参数:

DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)

path_or_buf :文件保存的路径;
sep :默认是以 , 进行分割 , 也可以自己制定;
columns : 保存索引列和指定列;
index:是否写进行索引 0或者1;
header :boolean or list of string, default True,是否写进列索引值 0或者 1;
na_rep=NaN: 缺失值保存为Na 如果不写默认为空;
float_format='%.2f' :保留两位小数;

再来回顾一下将我们的行索引装成日期格式的方法:

# 生成一个时间的序列，略过周末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')

# index代表行索引，columns代表列索引
new_data = pd.DataFrame(new_data, index=date)