DataFrame确实使用方便,但是如果每次导入数据都需要我们自己手动实现未免太麻烦了些,以下就介绍DataFrame对不同格式文件的导入
本章仅仅介绍txt或文本文件
带标题的文本文件,例如:
name pop eco hu
c 13 2 none
a 2 1 none
最简单的导入方式:
import pandas as pd
data=pd.read_table('test.txt',sep='\t')
print data
>>> name pop eco hu
0 c 13 2 none
1 a 2 1 none
但是当没有标题时,应加上header=None字段
data=pd.read_table('test.txt',sep='\t',header=None)
当数据的分割方式很混乱时,DataFrame也能相当好的处理此类文本,只要导入正确的正则表达式就可
如文本格式如下:(|,空格,逗号都是分隔符)
a|13,2 no
c 2,1 no
代码如下:
data=pd.read_table('test2',sep='