为什么样本方差要除以n-1

  这学期在外交换选的大部分是统计学院的课,前几天在课上教授偶然提到了样本方差与样本空间的方差 v ( x ) = 1 n ∑ i = 1 n ( x i − x ˉ ) 2 v(x)=\frac{1}{n}\sum_{i=1}^n (x_i-\bar x)^2 v(x)=n1i=1n(xixˉ)2不同,样本方差为 v ( x ) = 1 n − 1 ∑ i = 1 n ( x i − μ ) 2 v(x)=\frac{1}{n-1}\sum_{i=1}^n(x_i - \mu)^2 v(x)=n11i=1n(xiμ)2。这一块在以前学数理统计的时候就没太学明白,前两天另一门课又详细讲了简单随机抽样的过程,对我有了很大启发,之前困扰我的问题也解决了。

一、简单随机抽样

  假设一个样本空间 Ω = { 1 , 2 , . . . , 9 } \Omega=\{1,2,...,9\} Ω={ 1,2,...,9},每次从样本空间中随机抽取一个数X,要计算X小于5的概率,即 P ( X &lt; 5 ) P(X&lt;5) P(X<5)。但如果仔细想一想,当我们抽取了一个X,X应该是一个确认的常数,为什么会有小于5的概率呢?
  这是因为,我们感兴趣的不是选出特定那个数字小于5的概率。随机性来源于我们假定的随机在样本空间中抽取一个数字,并假设每个数字被抽取到的概率相等。这个过程叫做简单随机抽样(Simple Random Sample, SRS)。进一步说,我们感兴趣的是每次随机抽取一个数字,这个数字小于5的概率。
  然而,样本数据并不能反映数据的真实情况,因为随机抽样的随机性。例如在我们的例子內,假如我们做9次简单随机抽样,我们并不能保证数字1到9都会出现,这也是为什么,数据的总方差和样本方差是不一样的。

二、中心极限定理

  然而,由于中心极限定理,假设我们做n次简单随机抽样,当n是一个足够大数字的时候,我们随机抽样样本的均值 x ˉ \bar x xˉ是服从于正态分布的。
  我们知道,对正态分布重要的参数是变量的均值与方差,即 x ˉ \bar x xˉ的均值与方差。我们假设样本为 X = { x 1 , x 2 , . . . , x n } X = \{x_1,x_2,...,x_n\} X={ x1,x2,...,xn},样本均值为 x ˉ \bar x xˉ,总体均值为 μ \mu μ,样本方差为 S 2 S^2 S2,总体方差为 σ 2 \sigma^2 σ2,则:
E ( x ˉ ) = E ( 1 n ∑ i = 1 n x i ) ) = 1 n ∑ i = 1 n E ( x i ) = 1 n ⋅ n ⋅ E ( X ) = μ E(\bar x)=E(\frac{1}{n}\sum_{i=1}^n x_i))=\frac{1}{n}\sum_{i=1}^nE(x_i)=\frac{1}{n}\cdot n \cdot E(X)=\mu E(xˉ)=E(n1i=1nxi))=n1i=1nE(xi)=

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值