四分位数的数学计算以及使用pandas计算

前言

根据百度百科的描述,下四分位数是25%位置的数,也叫第一四分位数。上四分位数是75%位置的数,也叫第三四分位数。
所以这里必须了解到:下四分位数是小于上四分位数的。

计算方法

三个四分位数的确定:
先按从小到大方法排序,然后使用下列方法。
方法1:
Q1的位置= (n+1) × 0.25
Q2的位置= (n+1) × 0.5
Q3的位置= (n+1) × 0.75
n表示数据的数据个数。

上面的是大家常用的n+1法。还有一种是n-1法
方法2:
Q1的位置=1+(n-1)x 0.25
Q2的位置=1+(n-1)x 0.5
Q3的位置=1+(n-1)x 0.75

当位置结果为小数时,则用两个位置上的数分别乘以小数和(1-小数)后相加。例如,当结果为6.25时,就用第六个位置的数*0.25+第七个位置的数*0.75后得到结果。

下面举例说明。

举例1(奇数个)

假设有一组数据6,7,15,36,39,40,41,42,43,47,49
这组数已经经过排序,下面根据公式(n+1)法计算

第一四分位数(下四分位数)

(11+1)/4 =3,说明它在第三个位置,所以是15,即Q1=15。

中位数

(11+1)/4*2=6,所以是40。

第三四分位数(上四分位数)

(11+!)/4*3=9, 所以是43。
至此,Q1=15,Q2=40,Q3=43

下面根据公式(n-1)法计算
1+(11-1)x 0.25 =3.5,则Q1=15x0.5+36x0.5=25.5
1+(11-1)x 0.5 =6,则Q2=15x0.5+36x0.5=40
1+(11-1)x 0.75 =8.5,则Q3=42x0.5+43x0.5=42.5
下面用python实现计算。

import pandas as pd
s1 = pd.Series([6,7,15,36,39,40,41,42,43,47,49])
s1.describe()

结果如下:
Jupyter
可见,python运行出来的结果是Q1=25.5 Q2=40 Q3=42.5

运行结果与n-1法一样,说明python用的是这种方法。

举例2(偶数个)

方法一样。

结论

pandas使用的是n-1法,人们通常使用n+!法。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值