NOTE【数据分析】描述统计学

本文深入浅出地介绍了描述统计的基本概念与方法,包括平均值、中位数、四分位数、标准差和标准分等核心指标。通过这些指标,可以有效地理解和描述数据集的特征,如整体趋势、离散程度和异常值识别。特别强调了中位数和四分位数在异常值处理中的优势,并介绍了质量管理体系中的6西格玛理念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

           描述统计通俗来说就是对大量信息进行归纳,找出相应的指标对此进行描述。

也就是将复杂的数据简化为能起到描述性的数字(可衡量的指标)。

常用描述数据集整体情况的指标有:

1. 平均值

描述整体情况,但当有异常值或特殊值干扰时则不准确。

2. 中位数-四分位数

可避免异常值干扰,用箱线图描述。

Q3(上四分位)

Q2(中位数)

Q1(下四分位)

用Turkey‘s test 方法来识别异常值:

最小估计值:Q1 - K(Q3-Q1)

最大估计值:Q3 + K(Q3-Q1)

(K= 1.5: 中度异常;K = 3: 极度异常)

3. 标准差

用于衡量波动性、离散程度、变异性。

4. 标准分

标准分Z代表距离平均值有多少个单位的标准差,可衡量偏离平均值的程度(可用于质量管理)。

质量管理体系中,常用6西格玛体系。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值