seborn官网:link
什么是QQ图
看过写的最好的一篇是:link
理解qq图可以帮助我们探索数据属于哪种分布。
画出分位数的位置:
以上是正太分布、均匀分布、指数分布的标准曲线。
如果我们获得的现实数据集,画出直方图(hist)," 长得很像正太分布 " . 那该数据的分布就是近似的正太分布。
对这个数据集也求各种分位数。将标准正太分布的分位数做横轴,数据集对应的分位数做纵轴,出来的数据点应该近似是一条直线。 为什么呢?
因为 分布相近的话,那数据增长的比例也相近,比如,数据集的 i 分位数 / 正太分布的 i 分位数 = 常数(与i无关)。也可以从上面带有分位线的图形感受一下。
下面是一个QQ图的例子。
scipy 画 QQ图
stats.probplot(train_data['V0'], plot=plt)
用的是stats模块下的probplot这个函数,scipy本身不具有画图的功能这里使用matplotlib的pyplot作为画图工具。