基础假设检验

本文详细介绍了统计学中的假设检验,包括基本思想、基本步骤、p值的含义,以及单个正态总体均值的t检验、两个正态总体均值差的t检验、成对数据检验和正态总体方差的检验。通过实例展示了如何进行假设检验,帮助读者理解和应用假设检验进行统计推断。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

假设检验

一、假设检验的基本思想

运用试验结果对于一个命题的对错进行判断,假如试验结果与假设H发生矛盾就拒绝原假设H,否则就接受原假设.

二、假设检验的基本步骤

1、 建立假设



其中表示原假设表示备择假设.

2、 选择检验统计量

选择一个合适的检验统计量,使当原假设成立时,该统计量的分布完全已知。

3、 选择显著性水平as

由于样本的随机性,我们做出的判断并不能保证结论完全正确,而是会犯错的.显著性水平的选择是为了控制我们犯错的概率尽量小,以保证检验的结果是可以接受的。统计学上最常用的显著性水平是0.05,有时也选择0.10或0.01.

4、 给出拒绝域

在确定显著性水平后,我们可以定出检验的拒绝域.

5、 作出判断

通过检验统计量判断样本是否属于拒绝域,若是,则拒绝原假设,否则接受原假设.

三、检验的p值

在一个假设检验问题中,利用样本观测值能够做出“拒绝原假设”这一判断的最小显著性水平,就是检验的p值.

下面通过例子来直观说明p值含义:

例1

生物学家要研究某种药物对小白鼠反应时间是否有影响,实验测得100只经过药物作用的小白鼠的平均反应时间是1.05秒,样本标准差为0.5秒.已知小白鼠在未经药物作用时的平均反应时间为1.20秒,问药物对小白鼠的反应时间有无影响?

解答该问题首先提出假设:

:药物对小白鼠反应时间无影响.  vs:药物对小白鼠反应时间有影响.

由已知条件我们可以推断正常的小白鼠反应时间总体服从均值为1.2,标准差为0.05的正态分布(如图1).如果原假设成立,即药物对小白鼠的反应时间没有影响,那么小白鼠的反应时间应该和正常小白鼠一样服从图1所示的分布.


图1

然而我们通过实验得到的样本数据的均值为1.05,就是图中最左侧虚线的位置.这样问题就来了:在一个服从图1分布的正态总体中随机抽取一个样本,所抽取的样本均值为1.05的可能性有多大?

这个问题容易计算,只要将该均值和分布转化成标准正态分布的值,再查表就可以得出了.

这里我们不妨换一种思维方式来思考:样本均值(1.05)比总体均值(1.20)小了3倍标准差(0.05)的距离,这种事件发生的概率是非常小的,经过计算可得概率不超过0.3%,因此可以认为在这种分布下随机抽取出均值为1.05的样本的几乎是不可能的,这是一种极端的事件.之所以会出现这种极端事件是因为我们前面认为了原假设成立,而在统计推断时我们不希望这种极端事件的出现,因此根据样本数据我们只能拒绝原假设。

通过上述例子可以看出,p值的含义也可以理解为是在原假设成立的条件下,所抽取的样本事件发生的概率。

在上述问题中,当原假设成立时,样本均值大于1.35或小于1.05(图1中阴影部分)的概率经过计算可得不超过0.003,即p<0.003,也就是说如果我们通过实验得到一个样本均值落在阴影区域,这时应该拒绝原假设,否则的话我们所得到的样本数据就成了小概率事件(极端事件).

通常在作推断时我们会事先设定一个门槛(比如显著性水平为0.05),如果p值小于这个门槛,也就是说原假设成立时样本发生的概率太小了,此时我们应做出拒绝原假设的推断。

四、单个正态总体均值的t检验

是来自的样本,考虑如下三种关于的检验问题:

                                                                                         

其中是已知常数.这类问题需要对分已知和未知两种情况进行检验。已知时采用u检验法未知时采用检验法.

两种方法所选择的检验统计量以及拒绝域的形式如表1.


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值