Series 一组数据与之相关的数据索引组成,索引从0开始
pd.Series([9,8,7,6])
从标量值创建
pd.Series(25,index=[‘a’,’b’])//index不能省略,每一项都是25
从字典类型创建
pd.Series({‘a’:9,’b’:1}) pd.Series({‘a’:9,’b’:1},index=[‘c’,’a’])//这里index只是从字典中进行选择,没有的显示NaN,比如索引c对应NaN
从ndarray创建
pd.Series(np.arange(5),index=np.arange(9,4,-1))//数据从0到5,index省略时为0-5,这里索引是9到5,步长1
排序
a=pd.DataFrame(np.arange(20).reshape(4,5),index=[‘a’,’b’,’c’,’d’])
a.sort_values(2,ascending=False)//第2轴,就是第三列,降序 NaN统一放到末尾
基本的统计分析函数
a.describe()
数据的累积分析
.cummsum()//每个元素都是此位置加上上一行同位置元素之和
.cumprod()//每个元素都是此位置与上一行同位置元素之乘积
.cummin()//每个元素都是此列最小值
.cummiax()//每个元素都是此列最大值
滚动计算
.rolling(w).sum() //依次计算相邻w个元素(纵着看)的和
.rolling(w).mean()
.rolling(w).var()//方差
.rolling(w).std()//标准差
.rolling(w).min()
.rolling(w).max()
数据的相关分析 (两个事物正相关、负相关、不相关)
可以用协方差来判断
Pearson相关系数,【-1,1】
.cov()//计算协方差矩阵
.corr()//计算相关系数矩阵,Pearson等系数
例如,a.corr(b)就可以得到一个[-1,1]范围的Pearson系数值
2627

被折叠的 条评论
为什么被折叠?



