假设检验与两类错误

一. 假设检验的定义
1. 什么是假设检验

首先从一个例子引出假设检验的思想

假如一个盒子装了红白球共100个,张三说里面有99个是白球,现在从盒子中任取一球,结果取出的是红球,问张三的说法对吗?

对于这个问题,我们可以采取如下的思路来解决,先假定张三说的对,那么取出红球的概率p(红球)=1/100p(红球)=1/100p(红球)=1/100,也就是一次抽样取出红球是小概率事件,但现在一次抽样抽出红球,与小概率事件实际不符,所以我们认为原来的假定为假,这个盒子中不可能有99个白球。

假设检验先假设总体具有某种特征,例如总体的参数为多少,然后再通过对样本的加工,即构造统计量,推断出假设的结论是否合理。

假设检验依据的是小概率思想,即小概率事件在一次试验中基本上不会发生。

2. 假设检验的步骤

下面以一个案例来说明假设检验的步骤,假设某车间用一台包装机包装葡萄糖。已知每袋糖的净重是一个随机变量,且服从标准差为 0.015 kg 的正态分布。某日随机抽取它所包装的9袋糖,称得净重为(kg):
0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512 0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.5120.4970.5060.5180.5240.4980.5110.5200.5150.512
问每袋糖的净重的均值μ\muμ是不是0.5kg?

  1. 提出原假设与备择假设
    本例中原假设和备择假设分别为:H0:μ=0.5kgH_0: \mu = 0.5 kgH0:μ=0.5kgH1≠0.5kgH_1 \neq0.5kgH1=0.5kg

  2. 从所研究总体中出抽取一个随机样本
    本例中从总体中随机抽取了9个样本,通过经验我们知道样本的均值X‾\overline{X}X与总体的均值μ\muμ的差值不会太大,如果相差太大,我们就可以拒绝原假设H0H_0H0

  3. 构造检验统计量
    统计量Z=X‾−μδ/nZ = \frac{\overline{X} - \mu}{\delta/\sqrt{n}}Z=δ/nXμ(其中δ\deltaδ为总体标准差,nnn为样本数量)服从标准正太分布。

  4. 根据显著性水平确定拒绝域临界值
    在这里插入图片描述
    选择一个阈值kkk,根据标准正太分布的性质,当Z>kZ > kZ>kZ<−kZ < -kZ<k时,拒绝原假设H0H_0H0,当−k<=Z<=k-k <= Z <= kk<=Z<=k时不拒绝原假设H0H_0H0

    一般阈值的选择是由统计量落在拒绝域的概率确定,它叫做置信水平,用α\alphaα表示,一般取值为5%5\%5%

  5. 计算检验统计量与临界值进行比较
    根据抽样的样本,计算出统计量Z=(0.497+0.506+0.518+0.524+0.498+0.511+0.520+0.515+0.512)/9−0.50.015/3=2.24Z = \frac{( 0.497+0.506+0.518 +0.524+0.498+0.511+0.520+0.515+0.512) / 9 - 0.5}{0.015 / 3} = 2.24Z=0.015/3(0.497+0.506+0.518+0.524+0.498+0.511+0.520+0.515+0.512)/90.5=2.24
    根据5%5\%5%的置信水平计算出两端的阈值分别是−1.96-1.961.961.961.961.96,因为Z>1.96Z > 1.96Z>1.96,所以在置信度水平5%5\%5%的情况下,拒绝原假设H0H_0H0,即总体样本的均值不等于0.5kg0.5kg0.5kg

二. 假设检验的相关概念
1. 假设检验的两类错误
拒绝H0H_0H0不拒绝H0H_0H0
H0H_0H0为真第一类错误(α\alphaα)正确(1−α1-\alpha1α)
H0H_0H0为假正确(power=1−βpower=1-\betapower=1β)第二类错误(β\betaβ)

第一类错误:原假设为真,但我们却拒绝了它,对应假设检验的显著性水平,一般用α\alphaα表示。

第二类错误:原假设为假,但我们却没有拒绝它,一般用β\betaβ表示。

功效:当原假设为假,我们正确拒绝原假设的概率,它等于1−β1 - \beta1β

p值:当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率,如果p<αp < \alphap<α表明原假设发生的概率很小,但却发生了, 根据小概率事件,那么拒绝H0H_0H0,如果p>=αp >= \alphap>=α表明原假设发生的概率较大,那么不能拒绝H0H_0H0

2. 两类错误的计算

假如有如下假设检验,原假设H0:μ=0H_0: \mu = 0H0:μ=0,备择假设H1:μ=10H_1: \mu = 10H1:μ=10,下图所示,该假设检验的置信水平α\alphaα为红色横线填充的部分,功效β\betaβ为蓝色斜线填充的部分。
在这里插入图片描述

下面用代码演示下两类错误的计算:

from scipy.stats import norm

if __name__ == '__main__':
    alpha = 0.05
    rv = norm(loc=0, scale=10)
    zright = rv.ppf(1 - alpha)

    power = 1 - norm(loc = 10, scale = 10).cdf(zright)
    beta = 1 - power

    print("power = {:.2f}, beta = {:.2f}".format(power,beta))

运行结果:

power = 0.26, beta = 0.74

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值