python学习笔记-CSV文件读_usecols=[1]-优快云博客

本文介绍了使用 Python 的 Pandas 库进行 CSV 文件的读取和写入操作。包括如何利用 pd.read_csv() 读取文件，并通过参数 header、index_col 和 usecols 控制读取过程；以及如何用 pd.to_csv() 写入文件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

读取csv文件：pd.read_csv(),写入csv文件:pd.to_csv()

import pandas as pd
obj=pd.read_csv('test.csv')
print obj

  Unnamed: 0  c1  c2  c3
0          a   0   5  10
1          b   1   6  11
2          c   2   7  12
3          d   3   8  13
4          e   4   9  14

test.csv为有列索引没有行索引的数据，read_csv会自动加上行索引，即使原数据集有行索引。 read_csv读取的数据类型为Dataframe

header=None时，即指明原始文件数据没有列索引，这样read_csv为自动加上列索引，除非你给定列索引的名字。

obj_2=pd.read_csv('test.csv',header=None,names=range(2,5))
print obj_2

    2   3   4
0  c1  c2  c3
1   0   5  10
2   1   6  11
3   2   7  12
4   3   8  13
5   4   9  14

index_col为指定数据中那一列作为Dataframe的行索引，也可以可指定多列，形成层次索引，默认为None,即不指定行索引，这样系统会自动加上行索引

obj=pd.read_csv('test.csv',index_col=0)
print obj

   c1  c2  c3
a   0   5  10
b   1   6  11
c   2   7  12
d   3   8  13
e   4   9  14

usecols:可以指定原数据集中，所使用的列。在本例中，共有4列，当usecols=[1,2,3]时，即从第二列开始，之后令原始数据集的第二列为行索引。

obj_2=pd.read_csv('test.csv',index_col=0,usecols=[1,2,3])
print obj_2

nrows：可以给出从原始数据集中的所读取的行数，目前只能从第一行开始到nrows行。

obj_2=pd.read_csv('test.csv',index_col=0,nrows=3)
print obj_2

   c1  c2  c3
a   0   5  10
b   1   6  11
c   2   7  12