1. 无偏估计
1.1 核心概念与定义
无偏估计是统计学中点估计的一个核心属性,旨在确保估计量在长期平均意义下不会系统性地偏离真实参数值。
数学定义:
令 θ\thetaθ 为总体参数(如均值 μ\muμ、方差 σ2\sigma^2σ2、或回归系数 β\betaβ),θ^\hat{\theta}θ^ 为基于样本的估计量。一个估计量 θ^\hat{\theta}θ^ 是 θ\thetaθ 的无偏估计量,当且仅当 E[θ^]=θE[\hat{\theta}] = \thetaE[θ^]=θ,其中 E[θ^]E[\hat{\theta}]E[θ^] 是 θ^\hat{\theta}θ^ 的期望值,基于样本的概率分布计算。
直观解释:
- 无偏性意味着,如果你从同一总体中反复抽样并计算 θ^\hat{\theta}θ^,这些估计值的平均值会趋向于真实参数 θ\thetaθ。
- 例如,样本均值 Xˉ\bar{X}Xˉ 是总体均值 μ\muμ 的无偏估计量,意味着无论样本大小如何,Xˉ\bar{X}Xˉ 的期望总是 μ\muμ。
偏差:
偏差定义为 Bias(θ^)=E[θ^]−θ\text{Bias}(\hat{\theta}) = E[\hat{\theta}] - \thetaBias(θ^)=E[θ^]−θ。无偏估计量满足 Bias(θ^)=0\text{Bias}(\hat{\theta}) = 0Bias(θ^)=0。
1.2 为什么需要无偏估计?
- 统计推断的基础:无偏估计量是构建置信区间、假设检验等统计方法的基础。例如,置信区间的中心点通常是无偏估计量。
- 理论保证:无偏性提供了一个“公平”的估计标准,避免系统性误差。
- 可验证性:在理论分析中,无偏估计量的性质更容易推导和验证。
1.3 常见无偏估计量的推导与性质
以下详细推导几个经典的无偏估计量,展示其数学性质。
1.3.1 样本均值估计总体均值
场景:
假设从总体中抽取 nnn 个独立同分布 (i.i.d.) 的样本 X1,X2,…,XnX_1, X_2, \dots, X_nX1,X2,…,Xn,总体均值为 μ=E[Xi]\mu = E[X_i]μ=E[Xi],方差为 σ2=Var(Xi)\sigma^2 = \text{Var}(X_i)σ2=Var(Xi)。
估计量:
样本均值为 Xˉ=1n∑i=1nXi\bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXˉ=n1i=1∑nXi。
无偏性证明:
E[Xˉ]=E[1n∑i=1nXi]=1n∑i=1nE[Xi]=1n⋅nμ=μE[\bar{X}] = E\left[\frac{1}{n} \sum_{i=1}^n X_i\right] = \frac{1}{n} \sum_{i=1}^n E[X_i] = \frac{1}{n} \cdot n \mu = \muE[Xˉ]=E[n1i=1∑nXi]=n1i=1∑nE[Xi]=n1⋅nμ=μ
因此,Xˉ\bar{X}Xˉ 是 μ\muμ 的无偏估计量。
方差:
Var(Xˉ)=Var(1n∑i=1nXi)=1n2∑i=1nVar(Xi)=1n2⋅nσ2=σ2n\text{Var}(\bar{X}) = \text{Var}\left(\frac{1}{n} \sum_{i=1}^n X_i\right) = \frac{1}{n^2} \sum_{i=1}^n \text{Var}(X_i) = \frac{1}{n^2} \cdot n \sigma^2 = \frac{\sigma^2}{n}Var(Xˉ)=Var(n1i=1∑nXi)=n21i=1∑nVar(Xi)=n21⋅nσ2=nσ2
样本均值的方差随样本量 nnn 增加而减小,表明其稳定性提高。
1.3.2 样本方差估计总体方差
场景:
继续假设样本 X1,X2,…,XnX_1, X_2, \dots, X_nX1,X2,…,Xn,总体方差为 σ2=E[(Xi−μ)2]\sigma^2 = E[(X_i - \mu)^2]σ2=E[(Xi−μ)2]。
估计量:
样本方差定义为 S2=1n−1∑i=1n(Xi−Xˉ)2S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2S2=n−11i=1∑n(Xi−Xˉ)2,注意分母是 n−1n-1n−1,这是为了确保无偏性。
无偏性证明:
要证明 E[S2]=σ2E[S^2] = \sigma^2E[S2]=σ2,我们需要计算:
E[S2]=E[1n−1∑i=1n(Xi−Xˉ)2]E[S^2] = E\left[\frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2\right]E[S2]=E[n−11i=1∑n(Xi−Xˉ)2]
首先,展开平方项:
∑i=1n(Xi−Xˉ)2=∑i=1n(Xi−μ−(Xˉ−μ))2=∑i=1n(Xi−μ)2−n(Xˉ−μ)2\sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n (X_i - \mu - (\bar{X} - \mu))^2 = \sum_{i=1}^n (X_i - \mu)^2 - n (\bar{X} - \mu)^2i=1∑n(Xi−Xˉ)2=i=1∑n(Xi−μ−(Xˉ−μ))2=i=1∑n(Xi−μ)2−

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



