极差:range = max -min
方差:更适合离散趋势的描述
标准差
变异系数:标准差/均值,值越大,离散程度越大
切比雪夫定理:
在任何一个数据集中,至少有(1- 1/z^2)的数据项与平均数的距离在z个标准差之内,其中z是任意大于1的值
定理含义:
1. 至少有75%的数据项与平均数的距离在2个标准差之内
2. 至少有89%的数据项与平均数的距离在3个标准差之内
3. 至少有94%的数据项与平均数的距离在4个标准差之内
正态分布--最常用的连续型分布
关于正则分布的经验法则:
1. 约68%的数据项与平均数的距离在1个标准差之内
2. 约95%的数据项与平均数的距离在2个标准差之内
3.几乎全部数据项(99.97%)与平均数的距离在3个标准差之内