用Seaborn做数据可视化
Seaborn在Matplotlib的基础上开发了一套API,为默认的图形样式和颜色提供了理智的选择,为常用的统计图形定义了许多简单的高级函数,并与Pandas DataFrame的功能有机结合。Seaborn不仅有许多高级的画图功能,而且可以改写Matplotlib的默认参数,从而用简单的Matplotlib脚本获得更好的效果。Seaborn的主要思想是用高级命令为统计数据探索和统计模型拟合创建各种图形。
频次直方图
# Seaborn下的频次直方图
data = np.random.multivariate_normal([0, 0], [[5,2],[2,2]], size=2000)
data = pd.DataFrame(data, columns=['x', 'y'])
for col in 'xy':
plt.hist(data[col], normed=True, alpha=0.5)
KDE
#用KDE获取变量分布的平滑估计
for col in 'xy':
sns.kdeplot(data[col], shade=