(一)Python中的pandas模块进行数据分析。
- 数据结构简介:DataFrame和Series
- 数据索引index
- 利用pandas查询数据
- 利用pandas的DataFrames进行统计分析
- 利用pandas实现SQL操作
- 利用pandas进行缺失值的处理
- 利用pandas实现Excel的数据透视表功能
- 多层索引的使用
(二)读取行数据
1.读取头信息:data.head()
2.读取某几行信息:data.[[“A”,“B”]]或data.[[0,1]]
3.读取某列信息:data.columnName
4.读取范围类的列:data[0:4]等价于data.ix[0],data.ix[[1,3]]
5.读取某行信息:data[0]
(三)读取列数据
1.读取某行某列单元格中的数据:data.ix[0,3]
2.读取0-3行的4-6列数据:data.ix[0,3,4,6]=data.ix[0:3,‘columname01’,‘columname0n’]
3.data.ix[:,‘columname01’,‘columname0n’].head()
(四)按条件读取数据
1.读取满足条件的值:data.ix[data.columnname==“值”]
2.读取满足条件的值:data.ix[data.columnname.isin([“值1”,“值2”])]
(五)CSV\Excel导入导出
1.读取:pd.read_csv(“path”)
2.写入:data.to_csv(“path”,index=false)
(六)数据表操作
1.数据备份:backup=data.copy