何为箱线图~通过绘制一组数据的“最大值,最小值,中位数,上四分位数及下四分位”这五个指标来显示该数据的分散情况。作用是可以识别数据中的异常值,看看数据的偏态分布。
1:以数据集mtcars中的mpg数据为例
> boxplot(mpg, main = "Box plot", ylab = "Miles per Gallon")

boxplot()函数可以画出箱线图,具体的各个值则可以通过boxpolt.stats()清楚的显示出来,其中参数coef指定了“须”的长度的极限值,默认值是1.5,表示两条须的眼神极限不会超过盒型各端加1.5倍四分位距的范围,如果被置为0,那么两条须的延长极限就会一直打到数据集中的元素的极限位置哦,图中就不会有任何离群点。
> boxplot.stats(mpg, coef = 1.5, do.conf = T, do.out = TRUE)
$stats
[1] 10.40 15.35 19.20 22.80 33.90
$n
[1] 32
$conf
[1] 17.11916 21.28084
$out
numeric(0)
另外还有其他可以获得这5个指标,与fivenum()和boxplot.stats()都是以中位数计算为基础的,summary()和quantile()。