假设检验
一、假设检验的基本思想
运用试验结果对于一个命题的对错进行判断,假如试验结果与假设H发生矛盾就拒绝原假设H,否则就接受原假设.
二、假设检验的基本步骤
1、 建立假设
其中表示原假设,
表示备择假设.
2、 选择检验统计量
选择一个合适的检验统计量,使当原假设成立时,该统计量的分布完全已知。
3、 选择显著性水平as
由于样本的随机性,我们做出的判断并不能保证结论完全正确,而是会犯错的.显著性水平的选择是为了控制我们犯错的概率尽量小,以保证检验的结果是可以接受的。统计学上最常用的显著性水平是0.05,有时也选择0.10或0.01.
4、 给出拒绝域
在确定显著性水平后,我们可以定出检验的拒绝域.
5、 作出判断
通过检验统计量判断样本是否属于拒绝域,若是,则拒绝原假设,否则接受原假设.
三、检验的p值
在一个假设检验问题中,利用样本观测值能够做出“拒绝原假设”这一判断的最小显著性水平,就是检验的p值.
下面通过例子来直观说明p值含义:
例1
生物学家要研究某种药物对小白鼠反应时间是否有影响,实验测得100只经过药物作用的小白鼠的平均反应时间是1.05秒,样本标准差为0.5秒.已知小白鼠在未经药物作用时的平均反应时间为1.20秒,问药物对小白鼠的反应时间有无影响?
解答该问题首先提出假设:
:药物对小白鼠反应时间无影响. vs
:药物对小白鼠反应时间有影响.
由已知条件我们可以推断正常的小白鼠反应时间总体服从均值为1.2,标准差为0.05的正态分布(如图1).如果原假设成立,即药物对小白鼠的反应时间没有影响,那么小白鼠的反应时间应该和正常小白鼠一样服从图1所示的分布.
图1
然而我们通过实验得到的样本数据的均值为1.05,就是图中最左侧虚线的位置.这样问题就来了:在一个服从图1分布的正态总体中随机抽取一个样本,所抽取的样本均值为1.05的可能性有多大?
这个问题容易计算,只要将该均值和分布转化成标准正态分布的值,再查表就可以得出了.
这里我们不妨换一种思维方式来思考:样本均值(1.05)比总体均值(1.20)小了3倍标准差(0.05)的距离,这种事件发生的概率是非常小的,经过计算可得概率不超过0.3%,因此可以认为在这种分布下随机抽取出均值为1.05的样本的几乎是不可能的,这是一种极端的事件.之所以会出现这种极端事件是因为我们前面认为了原假设成立,而在统计推断时我们不希望这种极端事件的出现,因此根据样本数据我们只能拒绝原假设。
通过上述例子可以看出,p值的含义也可以理解为是在原假设成立的条件下,所抽取的样本事件发生的概率。
在上述问题中,当原假设成立时,样本均值大于1.35或小于1.05(图1中阴影部分)的概率经过计算可得不超过0.003,即p<0.003,也就是说如果我们通过实验得到一个样本均值落在阴影区域,这时应该拒绝原假设,否则的话我们所得到的样本数据就成了小概率事件(极端事件).
通常在作推断时我们会事先设定一个门槛(比如显著性水平为0.05),如果p值小于这个门槛,也就是说原假设成立时样本发生的概率太小了,此时我们应做出拒绝原假设的推断。
四、单个正态总体均值的t检验
设是来自
的样本,考虑如下三种关于
的检验问题:
其中是已知常数.这类问题需要对分
已知和未知两种情况进行检验。
已知时采用u检验法,
未知时采用
检验法.
两种方法所选择的检验统计量以及拒绝域的形式如表1.