总第143篇/张俊红
今天这篇聊聊统计学里面的置信度和置信区间,好像没怎写过统计学的东西,这篇试着写一写。
1.点估计
在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了。
现在你想要知道一个学校学生的身高情况,你可以把所有的学生测量一遍,然后得到答案,这种方法可以,而且得到的数据肯定是最真实的,但是这里有一个问题,什么问题呢?就是如果学生人数太多,全部测量的话工作量太大了,那怎么办呢?那就随机挑选一部分学生,然后测量这一部分学生的身高,得到一个值(一般用平均值),用这一部分的平均值来估计整体学生的身高情况,我们把这种估计方式称为点估计
。
现在你要看一下某流水线上 iphone 手机的不合格率,怎么看呢?最笨的方法还是把所有的手机全部开机试用,统计不合格手机的占比,这样可以吗?很明显是不可以的。那怎么才能知道这一条流水线的质量,那就是抽样,抽取整条流水线上的部分手机进行检验,会得到一个合格率,然后用这个合格率去估计整条流水线的合格率,同样这种方式也是点估计
。
那现在是不是大概理解点估计的意思了,就是用随机抽样的样本的计算出来的指标值去估计整体指标情况。常用的点估计方法有如下:
用样本均值估计总体均值
用样本方差估计总体方差
用样本的分位数估计总体分位数
用样本的中位数估计总体中位数
2.区间估计
以前上学的时候经常会考试,考完试以后老爱去估分,一般人估分不太可能直接估一个具体的数,肯定都是估一个大概的数,啥叫大概的数呢?就是比如高考分数预计 600 左右,这个左右其实就是一个区间,还有平常很多食品包装袋上会写 ±0.5&nbs