先介绍使用到的方法原理,也就是一种异常检测的方法。
首先要先了解箱线图。
箱线图
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。 ——MBAlib 箱线图
先看一下什么是箱线图,下面这个是常见的箱线图样子。

具体含义如下,首先计算出第一四分位数(Q1)、中位数、第三四分位数(Q3)。
中位数我们都知道,就是将一组数字按从小到大的顺序排序后,处于中间位置(也就是50%位置)的数字。
同理,第一四分位数、第三四分位数是按从小到大的顺序排序后,处于25%、75%的数字。
令 I Q R = Q 3 − Q 1 IQR=Q3-Q1 IQR=Q3−Q1 ,那么 Q 3 + 1.5 ( I Q R ) Q3+1.5(IQR) Q3+1.5(IQ

最低0.47元/天 解锁文章
1246

被折叠的 条评论
为什么被折叠?



