pandas 逐块读取文本文件
在pd.read_csv()函数中指定 nrows 值,可指定读取行数。
如图是ex6.csv在excel中打开,使用read_csv,将值计数聚合到‘key’中,代码如下:
chunker = pd.read_csv('E:\pydata-book-master\ch06\ex6.csv',chunksize=1000)
from pandas import DataFrame,Series
tot = Series([])
for piece in chunker:
tot = tot.add(piece['key'].value_counts(),fill_value=0)
tot = tot.order(ascending=False)
Series的add方法可以实现Series之间的加法,根据名称分别对应相加,对于不同时存在的名称,数值将变为fill_value
将数据写出到文本格式
利用DataFrame的to_csv方法,可以将数据写到一个以逗号分隔的文件中