python绘制箱线图boxplot——用于多组数据的比较, 异常值检测
介绍
本文系统详解利用python中seaborn.boxplot绘制箱图boxplot。seaborn.boxplot是atplotlib.pyplot.boxplot的封装版,更个性化的设置请研究matplotlib.pyplot.boxplot
箱线图方法简介
箱线图(Box-plot)是利用数据中的五个统计量:
第一四分位数、第三四分位数、中位数、上边缘、下边缘来描述数据的方法。
判断异常依据:
在Q3+1.5IQR(四分位距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;
在Q3+3IQR和Q1-3IQR处画两条线段,称其为外限。
处于内限以外位置的点表示的数据都是异常值,其中:
在内限与外限之间的异常值为温和的异常值(mild outliers),用于检测中度异常值,在外限以外的异常值为极端的异常值(extreme outliers&#