Head First Statistics eleven 样本与总体的估计

本文介绍了统计学中关键的两个参数——均值与方差,并解释了无偏估计的概念及为何方差的无偏估计使用n-1作为分母。此外,还探讨了如何利用样本数据来预测总体比例,以及在已知总体参数的情况下计算样本比例的概率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最主重要的两个参数

一、均值

  1. 均值的符号:样本均值X¯¯¯¯、均值点估计量μ^μ^、总体均值μμ
  2. 点估计量:是根据样本数据得到的最佳的总体均值的估计量,一般用到的方法有最小二乘法、似然函数

二、方差

  1. 方差的符号:样本方差s(包含有偏估计与无偏估计)、总体方差\sigma$
  2. 方差的无偏估计公式:\frac{1}{n-1}\sum _{i=1}^{n}(X_i-\overline x)
  3. 为什么无偏估计的分母为n-1?
    这里写图片描述

三、预测总体比例

  • 如果我们用X来表示总体成功的事件,则X符合二项分布。参数为n与p,n为事件的总数p为成功事件的概率。
  • 如果要预测总体的成功事件的概率,直观地看我们可以用样本的成功事件的概率作为总体成功事件的点估计。公式为PsPs=P^P^

    四、已知总体参数计算样本的概率

  • 在这里我们要求样本成功事件与总体事件的比例

  • 首先我们需要知道总体的参数,成功事件的概率为p
  • 我们需要知道每个样本的事件数量n
  • 然后就是求出最重要的两个样本参数E(PsPs)=p、Var(PsPs)=pqnpqn
  • 比例标准误差为Var(PsPs),我们可以看出当样本数量越大,误差就越小。
  • 根据中心极限定理,我们可以这样认为当n足够大时(一般为30)样本的成功事件比例的均值就服从于正态分布。(注意连续型修正)
  • 以上我们就能计算样本比例的概率了
  • 关于连续性修正:连续型概率分布近似替代离散型概率分布时,需要考虑连续型修正,用面积的思想来考虑就能理解了。因为单个离散型的变量在数轴上表示时是有区间段的,而连续型变量就是一个点。所以在取概率大小时,初始点不一样。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值