统计图应用实例讲解之箱形图应用分析

箱形图是一种统计图表,用于显示数据的离散程度和异常值。它由五数概括(最小值、下四分位数、中位数、上四分位数、最大值)组成,不受异常值影响,能清晰展示数据分布。在识别异常值时,温和异常值位于内限之外,极端异常值位于外限之外。箱形图常用于分析学生成绩分布,如显示学生英语成绩普遍优于数学成绩。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

箱形图定义

箱形图(Box-plot)是统计学中一种常见的统计数图,由于其图形与箱子类似而得名,所以又有"箱线图"、"盒须图"、"盒式图"等名称。箱形图可以统计出单变量数据的离散程度,将数据的离散程度以及分布区间清晰直观地表现出来,同时可以突出异常数据值。箱形图作为一种重要的统计图表,在众多的学科和领域中都有着越来越多的应用。

它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可以往盒图里面加入平均值(mean)。由于现实数据中总是存在各式各样地“脏数据”,也成为“离群点”,于是为了不因这些少数的离群数据导致整体特征的偏移,将这些离群点单独汇出,而盒图中的胡须的两级修改成最小观测值与最大观测值。这里有个经验,就是最大(最小)观测值设置为与四分位数值间距离为1.5个IQR(中间四分位数极差)。

分位数

概率分布的分位数(分为点)

定义:分位数指的就是连续分布函数中的一个点,这个点对应概率p。若概率0<p<1,随机变量X或它的概率分布的分位数Za,是指满足条件p(X≤Za)=α的实数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值