今天学的主要是利用pandas库进行文件的读写,所利用到它的功能主要有csv文件和excel文件的读写。
对于csv文件的写,它能够读入的python格式是字典格式,它会把字典的键设置为表头,把字典的值(通常把不同的值放在一个列表中)作为对应的内容。在把python格式的字典存入csv文件的同时,通常为同时生产一个没有表头的有顺序的序列(0,1,2,3...),它其实是一个行索引,不管它也无伤大雅。如果想要关闭这个索引(不写入)的话,将index=False即可。
对于csv文件的读,我们需要用到的方法是pd.read_csv(),读出来的结果类似于python的字典对象,要读一列的话,可以使用dict[”键名“]的格式,读出来的结果就是相应的一列。
对于excel文件的写,一般可以以列表的形式存入,是这样的格式:[(),(),()]没错,就是列表里面存元组,元组的内容就是对应excel表格中一行的内容,然后使用pd.DataFrame方法,出入该列表和对应的表名,用colnums参数传进去。
对于excel文件的读,要用到的是pd.read_excel()方法,直接传入excel表格的地址就行。要获取每行的内容,用一个循环读出就行,for i,j in excel.iterrows(),i是索引,j就是对应的一行的内容,可以把它当作字典,键就是列名。