最主重要的两个参数
一、均值
- 均值的符号:样本均值X¯¯¯¯X¯、均值点估计量μ^μ^、总体均值μμ
- 点估计量:是根据样本数据得到的最佳的总体均值的估计量,一般用到的方法有最小二乘法、似然函数
二、方差
- 方差的符号:样本方差s(包含有偏估计与无偏估计)、总体方差总体方差\sigma$
- 方差的无偏估计公式:\frac{1}{n-1}\sum _{i=1}^{n}(X_i-\overline x)
- 为什么无偏估计的分母为n-1?
三、预测总体比例
- 如果我们用X来表示总体成功的事件,则X符合二项分布。参数为n与p,n为事件的总数p为成功事件的概率。
如果要预测总体的成功事件的概率,直观地看我们可以用样本的成功事件的概率作为总体成功事件的点估计。公式为PsPs=P^P^
四、已知总体参数计算样本的概率
在这里我们要求样本成功事件与总体事件的比例
- 首先我们需要知道总体的参数,成功事件的概率为p
- 我们需要知道每个样本的事件数量n
- 然后就是求出最重要的两个样本参数E(PsPs)=p、Var(PsPs)=pqnpqn
- 比例标准误差为Var(PsPs),我们可以看出当样本数量越大,误差就越小。
- 根据中心极限定理,我们可以这样认为当n足够大时(一般为30)样本的成功事件比例的均值就服从于正态分布。(注意连续型修正)
- 以上我们就能计算样本比例的概率了
- 关于连续性修正:连续型概率分布近似替代离散型概率分布时,需要考虑连续型修正,用面积的思想来考虑就能理解了。因为单个离散型的变量在数轴上表示时是有区间段的,而连续型变量就是一个点。所以在取概率大小时,初始点不一样。