概念
四分位差(Interquartile Range,IQR)是统计学中衡量数据离散程度的一个指标,它表示数据中间50%的数值范围。具体来说,四分位差是第三四分位数(Q3)与第一四分位数(Q1)之间的差值,即:
其中:
- Q1(第一四分位数):也称为下四分位数,是位于数据集下半部分的中位数,即数据集中25%的数值低于Q1。
- Q3(第三四分位数):也称为上四分位数,是位于数据集上半部分的中位数,即数据集中75%的数值低于Q3。
优点:
- 对异常值不敏感:与全距相比,四分位差不受极端值的影响,更能反映数据的中心趋势和离散程度。
- 提供中间50%数据的分布信息:四分位差能够描述数据中间50%的数值分布范围,有助于了解数据的集中趋势。
举例
下面通过一个具体的例子来说明四分位差的计算:
假设我们有一组数据:10,35,15,18,20,22,25,28,30,12
-
排序数据:
10,12,15,18,20,22,25,28,