SPSS秩和检验

最新推荐文章于 2025-05-18 15:29:17 发布

原创最新推荐文章于 2025-05-18 15:29:17 发布 · 5.7k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#统计学 #概率论

本文介绍了秩和检验的基本概念，包括如何定义秩、如何进行两个样本的秩和检验，以及检验过程中的统计推断。通过混合并排序两个独立样本的观测值，计算秩和，然后基于秩和统计量判断是否拒绝原假设，即两个总体分布是否相同。这种方法适用于连续随机变量且不假设特定分布，尤其在数据非正态分布或方差不齐时适用。

一、背景知识

设总体 $X$ 和 $Y$ 为连续随机变量，其分布函数为 $F(x)$ 和 $G(x)$ ，从中分别抽取两个独立样本 $(X_1, X_2, ...., X_m)$ 和 $(Y_1, Y_2,...,Y_n)$ ，欲检验如下假设：

原假设 $H_0$ ： $F(x) = G(x)$ ，即假设两个总体分布相同。

定义：(秩) 设 $(X_1,X_2,...,X_m)$ 是抽自总体 $X$ 的样本， $(x_1, x_2, ...., x_m)$ 是样本观测值，按由小到大的次序排列 $x_1^* \leq x_2^*\leq ... \leq x_m^*$ 。若 $x_i = x_k^*$ ，则 $X_i$ 的秩就是 $k$ ，记作 $R_i = k$ ，即 $X_i$ 的秩就是，所有观测值由小到大排列后， $x_i$ 的序号。
若几个观测值相等，则它们的秩为各秩的平均值。

例如：某一样本观测值 {2，2，1，3，2，3}
排序 1，2，2，2，3，3
序号 1，2，3，4，5，6
3个2的秩为 (2+3+4) / 3 = 3
2个3的秩为 (5+6) / 2 = 5.5

注意：在重复抽样中，秩 $R_i$ 取不同数值，是一个随机变量
二、两个样本的秩和检验
1、将两个样本观测 $(x_1, x_2, ...., x_m)$ 与 $(y_1, y_2, ...., y_n)$ 混合，根据观测值由小到大排列，便可得到 $m+n$ 个秩。记 $X_i$ 的秩 $R_i$ ， $Y_j$ 的秩 $S_j$ ，那么我们将得到的秩样本代替原样本，于是两个新样本为 $(R_1, R_2, ..., R_m)$ 与 $(S_1, S_2, ..., S_n)$
2、比较新样本 $(R_1, R_2, ..., R_m)$ 与 $(S_1, S_2, ..., S_n)$ 容量大小，选择容量较小的样本。如果 $m=n$ , 则任选一个。不失一般性，我们假定 $m \leq n$ , 选择容量为 m 的样本，把此样本的秩加起来得秩和：

$T = \sum_{i=1}^{m} R_i$
我们用秩和统计量 $T$ 来检验原假设 $H_0$ , 秩和 $T$ 也是个离散随机变量，取值范围为：

$\{\frac{m(m+1)}{2}, \frac{m(m+1)}{2} +1, \dots, \frac{m(m+1)}{2} + mn \}$

当 $H_0$ ： $F(x) = G(x)$ 为真时，认为 $X$ 和 $Y$ 服从同一个分布，因此，第一个样本的秩一定随机分布在1到 m+n中，不会过度集中在较小或较大的数中，因此 $T$ 不会太靠近取值范围的两端。若太靠近取值范围的两端时，就认为出现了小概率事件，即：

   $P(T \leq T_1 ) + P(T \geq T_2 ) =\alpha, ~~~P(T \leq T_1 ) = P(T \geq T_2 ) = \frac{\alpha}{2}$
       对于给定的 $\alpha$ ，查秩和检验表得到 $T_1, T_2$ ，于是检验假设：若 $T \leq T_1$ 或 $T \geq T_2$ ，则拒绝 $H_0$ （即两个总体不是一个分布；否则接受 $H_0$ ；

这种检验法称为秩和检验。