统计推断与预测:理论、案例及注意事项
在统计学中,抽样过程的不同方式会对结果产生显著影响。当抽样不放回时,虽然期望值与有放回抽样相同,但方差和标准差会更小。这是因为这些量会通过有限总体校正因子((N - n)/(N - 1))进行调整。
抽样分布的性质也十分重要。以(\bar{X})的抽样分布为例,其期望值与总体均值相匹配,标准差会随着样本量的增加而减小,且由于是不放回抽样,减小速度更快,同时分布近似于正态曲线。
1. 检验与区间背后的概率
概率是进行假设检验、提供估计量的置信区间以及未来观测值的预测区间的基础。
- 假设检验 :依赖于零模型,该模型为统计量(\hat{\theta})提供概率分布。通常计算(P(\hat{\theta} \geq \text{观测统计量})),为了简化计算,常对随机变量进行标准化,即(P\left(\frac{\hat{\theta} - \theta_0}{SD(\hat{\theta})} \geq \frac{\text{观测统计量} - \theta_0}{SD(\hat{\theta})}\right))。当(SD(\hat{\theta}))未知时,可通过模拟进行近似;若有关于(SD(\hat{\theta}))的公式,可用样本标准差替代总体标准差。标准化后的分布若(\hat{\theta})近似正态分布,则标准化版本服从均值为(0)、标准差为(1)的标准正态分布,这在大量假设检验(如A/B测试)中非常有用。
- 置信区间 :以创建(95\%)置信区间为例,当估计量的抽样分布大致正态时,通过标准化使用概率(P\left(\frac{|\ha
超级会员免费看
订阅专栏 解锁全文
540

被折叠的 条评论
为什么被折叠?



