一、背景知识
设总体 和
为连续随机变量,其分布函数为
和
,从中分别抽取两个独立样本
和
,欲检验如下假设:
原假设
:
,即假设两个总体分布相同。
定义:(秩) 设 是抽自总体
的样本,
是样本观测值,按由小到大的次序排列
。若
,则
的秩就是
, 记作
,即
的秩就是,所有观测值由小到大排列后,
的序号。
若几个观测值相等,则它们的秩为各秩的平均值。
例如:某一样本观测值 {2,2,1,3,2,3}
排序 1,2,2,2,3,3
序号 1,2,3,4,5,6
3个2的秩为 (2+3+4) / 3 = 3
2个3的秩为 (5+6) / 2 = 5.5
注意:在重复抽样中,秩 取不同数值,是一个随机变量
二、 两个样本的秩和检验
1、将两个样本观测 与
混合,根据观测值由小到大排列,便可得到
个秩。记
的秩
,
的秩
,那么我们将得到的秩样本代替原样本,于是两个新样本为
与
2、比较新样本 与
容量大小,选择容量较小的样本。如果
, 则任选一个。不失一般性,我们假定
, 选择容量为 m 的样本,把此样本的秩加起来得秩和:
我们用秩和统计量 来检验原假设
, 秩和
也是个离散随机变量,取值范围为:
当 :
为真时,认为
和
服从同一个分布,因此,第一个样本的秩一定随机分布在1到 m+n中,不会过度集中在较小或较大的数中,因此
不会太靠近取值范围的两端。若太靠近取值范围的两端时,就认为出现了小概率事件,即:
对于给定的,查秩和检验表得到
,于是检验假设:若
或
,则拒绝
(即两个总体不是一个分布;否则接受
;
这种检验法称为秩和检验。



本文介绍了秩和检验的基本概念,包括如何定义秩、如何进行两个样本的秩和检验,以及检验过程中的统计推断。通过混合并排序两个独立样本的观测值,计算秩和,然后基于秩和统计量判断是否拒绝原假设,即两个总体分布是否相同。这种方法适用于连续随机变量且不假设特定分布,尤其在数据非正态分布或方差不齐时适用。
5461





