Python读取csv文件是一个常用用法,这里记录读取的几个常用方法。
1. 使用Python自带的csv包
代码如下
import csv
filename = './train.csv'
with open(filename,'r') as f:
reader=csv.reader(f)
上述代码读取本地路径下的一个文件train.csv。运行后,reader是一个指向csv文件的对象,我们要想使用它,可以将它转化为list,如data = list(reader)
在很多情况下,csv文件中存储的数据都有键值,因此适合使用词典(dict)型数据来存储。可直接调用DictReader函数进行读取,如
import csv
filename = './train.csv'
with open(filename,'r') as f:
reader=csv.DictReader(f)
需要注意的是,读取后的对象reader只可以被遍历一次,因此需尽快转存为其他对象。2、使用Pandas
我也是刚接触到pandas dataframe,发现真的好用。使用pandas导入csv数据,同样只需要一句,
import pandas as pd
data = pd.read_csv('./train.csv')
返回的data便是pandas dataframe。可以使用
data.info()
查看data的具体内容。