统计学基础3
假设检验
定义
假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
基本原理
1.先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
2.它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。
案例
假设检验在卷烟质量判断中的应用
在卷烟生产企业经常会遇到如下的问题:卷烟检验标准中要求烟支的某项缺陷的不合格品率P不能超过3%,现从一批产品中随机抽取50支卷烟进行检验,发现有2支不合格品,问此批产品能否放行?按照一般的习惯性思维:50支中有2支不合格品,不合格品率就是4%,超过了原来设置的3%的不合格品率,因此不能放行。但如果根据假设检验的理论,在α=0.05的显著性水平下,该批产品应该可以放行。这是为什么呢?
最关键的是由于我们是在一批产品中进行抽样检验,用抽样样本的质量水平来判别整批的质量水平,这里就有一个抽样风险的问题。举例来说,我们的这批产品共有10000支卷烟,里面有4支不合格品,不合格品率是0.04%,远低于3%的合格放行不合格品率。但我们的检验要求是随机抽样50支,用这50支的质量水平来判别整批 10000支的质量水平。如果在50支中恰好抽到了2支甚至更多的不合格品,简单地用抽到的不合格品数除以50来作为不合格品率来判断,那我们就会对这批质量水平合格的产品进行误判。
如何科学地进行判断呢?这就要用到假设检验的理论。
- 步骤1:建立假设
要检验的假设是不合格品率P是否不超过3%,因此立假设
H0:P≤0.03
这是原假设,其意是:与检验标准一致。
H1:P>0.03
- 步骤2:选择检验统计量,给出拒绝域的形式
若把比例P看作n=1的二项分别b(1,p)中成功的概率,则可在大样本场合(一般n≥25)获得参数p的近似μ的检验,可得样本统计量: 近似服从N(0,1)
其中=2/50=0.04,p=0.03,n=50
-
步骤3:给出显著性水平α,常取α=0.05。
-
步骤4:定出临界值,写出拒绝域W。
根据α=0.05及备择假设知道拒绝域W为
-
步骤5:由样本观测值,求得样本统计量,并判断。
-
结论:在α=0.05时,样本观测值未落在拒绝域,所以不能拒绝原假设,应允许这批产品出厂。
假设检验中的两类错误
进一步研究一下这个例子,在50个样品中抽到多少个不合格品,就要拒绝入库呢?我们仍取α=0.05,根据上述公式,得出,解得x>3.48,也就是在50个样品中抽到4个不合格品才能判整批为不合格。
而如果我们改变α的取值,也就是我们定义的小概率的取值,比如说取α=0.01,认为概率不超过0.01的事件发生了就是不合理的了,那又会怎样呢?还是用上面的公式计算,则得出,解得x>4.30,也就是在50个样品中抽到5个不合格品才能判整批为不合格。检验要求是不合格品率P不能超过3%,而现在根据α=0.01,算出来50个样品中抽到5个不合格品才能判整批为不合格,会不会犯错误啊!假设检验是根据样本的情况作的统计推断,是推断就会犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类:
1. 第一类错误(拒真错误):原假设H0为真(批产品质量是合格的),但由于抽样的随机性(抽到过多的不合格品),样本落在拒绝域W内,从而导致拒绝H0(根据样本的情况把批质量判断为不合格)。其发生的概率记为α,也就是显著性水平。α控制的其实是生产方的风险,控制的是生产方所承担的批质量合格而不被接受的风险。
2. 第二类错误(取伪错误):原假设H0不真(批产品质量是不合格的),但由于抽样的随机性(抽到过少的不合格品),样本落在W外,从而导致接受H0(根据样本的情况把批质量判断为合格)。其发生的概率记为β。β控制的其实是使用方的风险,控制的是使用方所承担的接受质量不合格批的风险。
再回到刚刚计算的上例的情况,α由0.05变化为0.01,我们对批质量不合格的判断由50 个样本中出现4个不合格变化为5个,批质量是合格的而不被接受的风险就小了,犯第一类错误的风险小了,也就是生产方的风险小了;但同时随着α的减小对批质量不合格的判断条件其实放宽了——50个样本中出现4个不合格变化为5个,批质量是不合格的而被接受的风险大了;犯第二类错误的风险大了,也就是使用方的风险大了。 在相同样本量下,要使α小,必导致β大;要使β小,必导致α大,要同时兼顾生产方和使用方的风险是不可能的。要使α、β皆小,只有增大样本量,这又增加了质量成本。
参考文献:
https://blog.youkuaiyun.com/ch1209498273/article/details/78313883
https://blog.youkuaiyun.com/ch1209498273/article/details/78314138
https://blog.youkuaiyun.com/andy_shenzl/article/details/81453509