四分位的概念:
把一个数组从小到大排序,
中位数是中间那个数
上四分位数是排在1/4的那个数
下四分位数是排在3/4的那个数
如果用EXCEL计算($A$1:$A$9为数列)
最小值=QUARTILE($A$1:$A$9,0)
上四分位数=QUARTILE($A$1:$A$9,1)
中位数=QUARTILE($A$1:$A$9,2)
下四分位数=QUARTILE($A$1:$A$9,3)
最大值=QUARTILE($A$1:$A$9,4)
分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值.如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是 四分位数;八等分就是八分位数等.四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位 数.四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用Q1、 Q2、Q3表示.四分位数作为分位数的一种形式,在统计中有着十分重要的作用和意义,现就四分位数的计算做一详细阐述.
一、资料未分组四分位数计算
第一步:确定四分位数的位置.Qi 所在的位置=i(n+1)/4,其中i=1,2,3.n表示资料项数.
第二步:根据第一步四分位数的位置,计算相应四分位数.
例1:某数学补习小组11人年龄(岁)为:17,19,22,24,25,
28,34,35,36,37,38.则三个四分位数的位置分别为:
Q1所在的位置=(11+1)/4=3,Q2所在的位置=2(11+1)/4=6,Q3所在的位置=3(11+1)/4=9.
变量中的第三个、第六个和第九个人的岁数分别为下四分位数、中位数和上四分位数,即:
Q1=22(岁)、Q2=28(岁)、Q3=36(岁)
我 们不难发现,在上例中(n+1)恰好是4的整数倍,但在很多实际工作中不一定都是整数倍.这样四分位数的位置就带有小数,需要进一步研究.带有小数的位置 与位置前后标志值有一定的关系:四分位数是与该小数相邻的两个整数位置上的标志值的平均数,权数的大小取决于两个整数位置的远近,距离越近,权数越大,距 离越远,权数越小,权数之和应等于1.
例2:设有一组经过排序的数据为12,15,17,19,20,23,25,
28,30,33,34,35,36,37,则三个四分位数的位置分别为:
Q1所在的位置=(14+1)/4=3.75,Q2所在的位置=2(14+1)/4=7.5,Q3所在的位置=3(14+1)/4=11.25.
变量中的第3.75项、第7.5项和第11.25项分别为下四分位数、中位数和上四分位数,即:
Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;
Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5;
Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25.
使用此方法的难点:
1.怎样在sql里面判断数的个数+1是否是4的整数倍以及不是4的整数倍分两种情况进行计算
2.如果数的个数+1是4的整数倍采用第一种方法算时确定了数的位置,那么在sql里面怎样获取那个数 这个数为对应的4分位数
3.如果确定使用第二种方式计算,怎样在sql里面获取对数的位置为小数的数向下取整和向上取整然后获取那个位置的数 这个数为对应的4分位数
(此方法大致看了一下 比较复杂没看懂 而且也不满足本人的需求,所以就没做具体总结,有需要用的朋友可以尝试总结一下,总结好了记得分享一下哦!)
二、资料已整理分组的组距式数列四分位数计算
第一步:向上或向下累计次数(因篇幅限制,以下均采取向上累计次数方式计算);
第二步:根据累计次数确定四分位数的位置:
Q1的位置 = (∑f+1)/4,Q2的位置 = 2(∑f +1)/4,Q3的位置 = 3(∑f +1)/4
式中:∑f表示资料的总次数;
第三步:根据四分位数的位置计算各四分位数(向上累计次数,按照下限公式计算四分位数):
Qi=Li+■×di
式中:Li——Qi所在组的下限,fi——Qi所在组的次数,di——Qi所在组的组距;Qi-1——Qi所在组以前一组的累积次数,∑f——总次数.
例3:某企业工人日产量的分组资料如下:
根据上述资料确定四分位数步骤如下:
(1)向上累计方式获得四分位数位置:
Q1的位置=(∑f +1)/4=(164+1)/4=41.25
Q2的位置=2(∑f +1)/4=2(164+1)/4=82.5
Q3的位置=3(∑f +1)/4=3(164+1)/4=123.75
(2)可知Q1,Q2,Q3分别位于向上累计工人数的第三组、第四组和第五组,日产量四分位数具体为:
Q1=L1+■×d1=70+■×10=72.49(千克)