统计数据可视化与分析
1. 偏度(Skewness)
偏度用于描述分布关于众数的不对称性。负偏度(左偏)表示图形左侧的面积大于众数左侧的面积;正偏度(右偏)则表示图形右侧的面积大于众数右侧的面积。
Incanter 在 stats 命名空间中有一个内置函数用于测量偏度,示例代码如下:
(defn ex-1-20 []
(let [weights (take 10000 (dishonest-baker 950 30))]
{:mean (mean weights)
:median (median weights)
:skewness (s/skewness weights)}))
此示例表明,不诚实面包师的产出偏度约为 0.4,这量化了直方图中明显的偏态。
2. 分位数 - 分位数图(Quantile - Quantile Plots)
分位数是描述数据分布的一种方式。分位数函数接受一个介于 0 和 1 之间的数字,并返回序列在该点的值,其中 0.5 对应中位数。
将数据的分位数与正态分布的分位数进行绘图,可以直观地比较测量数据与理论分布。这种图称为 Q - Q 图,它能快速直观地判断数据的正态性。若数据与正态分布接近,Q - Q 图为一条直线;若偏离直线,则表明数据偏离了理想的正态分布。
以下代码用于绘制诚实和不诚实面包师的 Q - Q 图:
(defn ex-1-21 []
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



