目录
- 基于标准差(SD)法
- 基于MAD的中心距离计算法
a为一组数的平均数,b为这组数的标准差,则超出[a-2b, a+2b]范围的值即被认为离群值。
总结
这种方法不是特别的靠谱,因为离群值的出现可能反过来很大程度影响平均数和标准差,所以平均数或者标准差受离群值的制约而使得这个检测方法不靠谱。
2.基于绝对离差中位数(Median Absolute Deviation, MAD)的中心距离计算法
(1)计算所有观察点的中位数median(X);
(2)计算每个观察点与中位数的绝对偏差值abs(X-median(X));
(3)计算(2)中的绝对偏差值的中位数,即MAD = median(abs(X - median(X)));
(4)将(2)得到的值除以(3)的值,得到一组基于MAD的