学习资料:
“摘要”即有损地提取数据特征的过程
1 数据的排序
.sort_index(axis=0,ascending=True)
在指定轴上将数据根据索引排序,默认升序
(竖着的是0轴,横着是1轴)

Series.sort_values(axis=0,ascending=True)
在指定轴上根据数值进行排序,默认升序
DataFrame.sort_values(by,axis=0,ascending=True)
by:axis轴上的某个索引或索引列表,既可以索引index也可以索引volumn

在排序中,NaN统一放到排序末尾

2 数据的基本统计分析
基本统计分析函数(Series和DataFrame通用)

.describe()

discribe方法作用于Series时,输出是一个Series类型的对象,因此可以用Series索引的方法获取对应的值

discribe方法作用于DataFrame时,输出是一个DataFrame类型的对象
如果想要获取某一列的各项统计值,可以采用.describe().ix[‘对应column的索引’]方法

只适用于Series类型

3 数据的累计统计分析
累计统计分析函数(Series和DataFrame通用)

默认沿着列方向进行累计统计

滚动计算(窗口计算)函数 (Series和DataFrame通用)
加入.rolling(w)命令,表示在列的方向上每隔w个元素进行一次运算

4 数据的相关分析
4.1 度量两个变量相关性的方法
协方差法

Pearson相关系数

4.2 相关分析函数

.cov() (Series和DataFrame通用)
.corr() (Series和DataFrame通用)

!!!完结撒花!!!
打算开下一个系列:
目前主要学习李沐的动手学深度学习,再搭配看一些统计学习方法的理论知识和吴恩达的机器学习课程