这儿是给数据分析师的23个Pandas代码,可以帮助你更好地理解数据!Pandas想必从事数据分析的各位都懂,这是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。还不熟悉的新手可以复制官网链接,10分钟快速了解下:http://pandas.pydata.org/pandas-docs/stable/10min.html
应用案例集合也可以看看:http://pandas.pydata.org/pandas-docs/stable/cookbook.html
(1)读入CSV数据集
pd.DataFrame.from_csv('csv_file')
或者:
pd.read_csv('csv_file')
注:如果遇到读spss数据集,先将数据导入spss modeler中(【源】选项卡下的【Statistics】节点拖至数据流编辑区,鼠标右键选择弹出菜单的编辑选项,导入spss数据),再以csv格式导出(【输出】选项下【表格】节点,以.svc导出)。
(2)读入Excel数据集
pd.read_excel('excel_file')
(3)直接把数据写入CSV
如数据以逗号分隔,且没有索引:
df.to_csv('data.csv'