统计学学习笔记——(4)差异性

箱线图和IQR

箱线图(Box Plot):是由一组数据的最大值(maximum),最小值(minimum),中位数(median),两个四分位数(quartiles)这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。

四分位距(interquartile range,IQR):又称四分差,是第三四分位数和第一四分位数之间的距离。其计算公式为:

Qd=Q3Q1

四分位距反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。

image.png

离群值(Outlier):是指数据中一个或几个数值与其他数值相比差异较大的值。可以通过IQR来识别离群值,我们可以定义离群值以外的观测值范围为:

[Q11.5(Q3Q
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值