一、背景知识
设总体 和
为连续随机变量,其分布函数为
和
,从中分别抽取两个独立样本
和
,欲检验如下假设:
原假设
:
,即假设两个总体分布相同。
定义:(秩) 设 是抽自总体
的样本,
是样本观测值,按由小到大的次序排列
。若
,则
的秩就是
, 记作
,即
的秩就是,所有观测值由小到大排列后,
的序号。
若几个观测值相等,则它们的秩为各秩的平均值。
例如:某一样本观测值 {2,2,1,3,2,3}
排序 1,2,2,2,3,3
序号 1,2,3,4,5,6
3个2的秩为 (2+3+4) / 3 = 3
2个3的秩为 (5+6) / 2 = 5.5
注意:在重复抽样中,秩 取不同数值,是一个随机变量
二、 两个样本的秩和检验
1、将两个样本观测 与
混合,根据观测值由小到大排列,便可得到
个秩。记
的秩
,
的秩
,那么我们将得到的秩样本代替原样本,于是两个新样本为
与
2、比较新样本 与
容量大小,选择容量较小的样本。如果
, 则任选一个。不失一般性,我们假定
, 选择容量为 m 的样本,把此样本的秩加起来得秩和:
我们用秩和统计量 来检验原假设
, 秩和
也是个离散随机变量,取值范围为:
当 :
为真时,认为
和
服从同一个分布,因此,第一个样本的秩一定随机分布在1到 m+n中,不会过度集中在较小或较大的数中,因此
不会太靠近取值范围的两端。若太靠近取值范围的两端时,就认为出现了小概率事件,即:
对于给定的,查秩和检验表得到
,于是检验假设:若
或
,则拒绝
(即两个总体不是一个分布;否则接受
;
这种检验法称为秩和检验。