上一节我们聊过 四分位数,其实还有十分位数,都是一样的计算方法。他们都是获取数据的分散性。
通过箱线图来体现。
但有的时候,我们可能会对数据要求更高,希望 获取其中的变异性,如工资变化差异到底多大,屌丝公司基本都是1.5-3K,土豪公司可能1w,5w,8w各种都有。
那么如果知道公司的工资是有很多档位呢?
————————————
方法:每个数值和均值的距离!这样就知道数据的变异情况
**实际情况是:各个数据和μ的差值的平均距离==0【大家可以自己用脚底板想想】
平均距离 = ((1-μ)+(2-μ)+...+(n-μ))/n = 0
现在咋办?结果是0
要想办法解决这个抵消的问题,我们这样试一下:
平均距离² = ((1-μ)²+(2-μ)²+...+(n-μ)²)/n 这样不会抵消了。都是正数!!
它就是大名鼎鼎的 “方差”,它是度量数据分散性的一种方法,数值和均值距离的平方数的平方值!
方差= Σ(x-μ)²/n
但是,有人觉得不可理解,为什么要弄个平方,感觉很奇怪呢。
OK
——————
那我在方差上开个根号,得到的值。我们叫标准差,它也有专用符号