均值估计标准差(Standard Deviation) 和 标准误差(Standard Error)

本文介绍了标准差和标准误差的区别及其在统计中的作用。标准差描述数据点围绕均值的分布,而标准误差用于估计样本均值的精度。在正态分布中,标准差可帮助理解数据的分布范围。标准误差是基于样本标准差和样本大小计算的,用于构建置信区间,反映均值估计的稳定性。选择SD、SE和CI应根据报告需求,SD是数据报告必需的,SE用于计算置信区间,CI是显著性检验的补充。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近一直在研究均值估计之类的问题,下午正好有机会和大家分享一下.

    本文摘自

    Streiner DL.Maintaining standards: differences between the standard deviation and standarderror, and when to use each. Can J Psychiatry 1996; 41: 498–502.

    


    

 

    

 

    

标准差(Standard Deviation)

 

    标准差,缩写为S.D., SD, 或者 s (就是为了把人给弄晕?),是描述数据点在均值(mean)四周聚集水平的指标。

 

    如果把单个数据点称为“Xi,” 因此 “X1” 是第一个值,“X2” 是第二个值,以此类推。均值称为“M”。初看上去Σ(Xi-M)就可以作为描述数据点散布情况的指标,也就是把每个XiM的偏差求和。换句话讲,是(单个数据点—数据点的均匀)的总和。

 

    看上去挺有逻辑性的,但是它有两个缺点。

 

    第一个困难是:上述定义的结果永久是0。根据定义,高出均值的和永久即是低于均值的和,因此它们相互抵消。可以取差值的绝对值来处理(也就是说,忽略负值的符号),但是由于各种神秘兮兮的原因,统计学家不喜欢绝对值。另外一个剔除负号的方法是取平方,因为任何数的平方肯定是正的。所以,我们就有Σ(Xi-M)2

 

    另外一个问题是当我们增加数据点后此等式的结果会随之增大。比如我们手头有25个值的样本,根据前面公式计算出SD是10。如果再加25个一模一样的样本,直觉上50个大样本的数据点分布情况应当不变。但是我们的公式会产生更大的SD值。好在我们可以通过除以数据点数量N来填补这个漏洞。所以等式就酿成Σ(Xi-M)2/N.

 

    根据墨菲定律,我们处理了两个问题,就会随之产生两个新问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值