2019年01月03日,科研学术论文作图第4篇,今天讲可以判断异常值的箱形图。
----------------------------------------------------
箱形图,是一种用作显示一组数据分散情况的统计图。其基本内容请见下面例图。
将一组数据从大到小排列,分别计算出他的上边缘,上四分位数Q3,中位数,下四分位数Q1,下边缘,还有一个异常值。
第一四分位数 (Q1),又称"较小四分位数",等于该样本中所有数值由小到大排列后第25%的数字。
第二四分位数 (Q2),又称"中位数",等于该样本中所有数值由小到大排列后第50%的数字。
第三四分位数 (Q3),又称"较大四分位数",等于该样本中所有数值由小到大排列后第75%的数字。
第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range, IQR)。
超过上下边缘的值即是异常值。
上边缘(上须触线)的计算公式为=min(最大值,Q3+1.5*IQR)。
下边缘(下须触线)的计算公式为=max(最小值,Q1-1.5*IQR)。
-------------------------------------------------------
下面举例说明箱形图的做法。
A列为在某条件下的检测次数,B列为最初的无序的检测数值,C列为按照大小排列之后的顺序。按照上述计算公式,可以得到各数值(作图时不需要自己计算,本例中给出数值,是为了说明各个数据的意义)。
(1)选中B2-B12单元格,点击“插入”-“图表”-“所有图表”-“箱形图”,即可得到草图。
(2)按照科技作图6元素原则,对草图优化即可。
---------------------------------------------------------------------
例图来源: