68-95-99.7法则

4025027-018372949b3ff6f8.png

在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。若其假设正确,则约 68% 数值分布在距离平均值有 1 个标准差之内的范围,约 95% 数值分布在距离平均值有 2 个标准差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。称为"68-95-99.7法则"。

PS:对于不符合正态分布的数据,该法则依然适用,根据中心极限定理
设从均值为μ、方差为σ2总体中抽取样本量为n的样本,当抽取次数充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。

正态分布(也称为高斯分布)是一种在自然界和人类社会中广泛存在的分布形态。在正态分布中,数据围绕一个中心值对称分布,该中心值是平均值(μ)和中位数。分布的形状由其标准差(σ)决定,标准差越小,分布越集中;标准差越大,分布越分散。 对于正态分布而言,95%的数据位于平均值左右1.96个标准差之内,这是根据正态分布的性质来的,其中正态分布的累积分布函数(CDF)在平均值加减1.96个标准差时分别约为2.5%和97.5%。这个规则是基于经验法则,也称为“68-95-99.7法则”,意味着大约68%的数据位于平均值加减一个标准差的范围内,95%的数据位于平均值加减两个标准差的范围内,99.7%的数据位于平均值加减三个标准差的范围内。 在Matlab中,如果你想要计算对应于95%置信区间(或者尾部概率为2.5%在每侧)的标准差倍数,你可以使用以下代码来找到对应的z分数: ```matlab % 计算正态分布的z分数对应于95%置信区间 p = 0.95; % 总的概率是95%,所以每侧是2.5% alpha = 1 - p; % 每侧的尾部概率是5% z_score = norminv(1 - alpha/2, 0, 1); ``` 这段代码使用了`norminv`函数,它是Matlab中计算正态分布逆累积分布函数(invCDF)的函数。`norminv`函数的第三个和第四个参数分别是均值(这里假设为0)和标准差(这里假设为1,因为我们在计算标准正态分布的z分数)。`1 - alpha/2`表示我们要查找的是97.5%的累积概率,因为我们对95%置信区间感兴趣。 运行上述代码后,`z_score`的值将是1.96,这是对应于95%置信区间的标准差倍数。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值