pandas通过对索引的操作来实现对数据的操作
一、数据的排序
二、数据的基本统计分析
三、累计统计分析
四、数据的相关分析
如何统计相关性?协方差
描述“相关性” 更精确的公式和方法:Pearson相关系数
实例:房价增幅与M2增幅的相关性
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
hprice = pd.Series([3.04,22.93,12.75,22.6,12.33],index = ['2008','2009','2010','2011','2012'])
m2 = pd.Series([8.18,18.38,9.13,7.82,6.69],index = ['2008','2009','2010','2011','2012'])
print(hprice.corr(m2))
plt.plot(['2008','2009','2010','2011','2012'],hprice)
plt.plot(['2008','2009','2010','2011','2012'],m2)
plt.show()
输出 :0.52,中等相关性