样本方差的期望_统计学——样本方差公式的由来

本文探讨了样本方差公式中除以n-1的原因,解释了无偏估计的概念。通过举例说明,指出除以n会导致样本方差低估总体方差,而通过调整为n-1,样本方差的期望成为总体方差的无偏估计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

b2b85b44382a28b5f31ab028a4cedfb9.png

(一直不知道样本方差公式里的n-1怎么样来的,看优快云大神的文章后如醍醐灌顶=w=)

那么我们首先来看一哈教科书里的知识——

设样本均值为X(X拔,上面的横线打不出来55,下同),样本方差为S^2,总体均值为μ,总体方差为σ^2,那么样本方差S^2有如下公式:

bf81d85882c838ac9ef652adc088038c.png

很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。

无偏估计

以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为X1。如果你只是把X1作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:X1、X2……Xk。然后在把这些平均值,再做平均,记为:E(X),这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值μ,如果满足 E(X) = μ ,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,样本均值就是总体均值的一个取值。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:

99ee89970b815a43a082450ff8e41046.png

那么,我们根据无偏估计的定义可得:

00f988dbad6a6a7e2dbb5f2d85378e5a.png

2dc02d80e25112e6835ef142c0d91d68.png

由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:

1e86d0c3e7464dd064aa494ab678a5f9.png

到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。

dd8d0221a41506c5256e77a7e0016bad.png

如果让我们假设的样本方差乘以,即修正成如下形式,是不是可以得到样本方差是总体方差的无偏估计呢?

2ee7bc17b8296756a30dd768980f5a45.png

则:

be733378b5ee80afe8f9bef4a5de4088.png

因此修正之后的样本方差的期望是总体方差的一个无偏估计,这就是为什么分母为何要除以n-1。

---------------------

参考自:https://blog.youkuaiyun.com/Hearthougan/article/details/77859173

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值