异常值分析
异常值分析高大上的名字叫离群点分析,其目的就是从一个数据集中找出这个数据集不符合正常事务范畴的数据。有三种方式,简单的观测方法这个靠经验,另外两种分别是:基于正态分布的方式 3 σ \sigma σ 原则分析 与 箱型图分析。
箱型图分析
此时有一个观察数据集,需要从这个观察数据集合中找到一批异常值。根据需要使用箱型图分析来查找。首先对这个观察数据集取值进行从小到大排序,当然从大到小也可以。对数据进行以数据大小进行分割,分割的选择 Q U Q_U QU 上四分位 和 Q L Q_L QL 下四分位。
Q U Q_U QU 上四分位 是指全部观察数据集中有四分之一的数据取值比当前这个数据取值大;
Q L Q_L Q