非参数统计基础2——秩和检验
秩和检验是除Person外另一类核心非参数方法,包括它的衍生方法(符号检验、符号秩和检验)。秩和检验的核心用来解决“两个总体分布是否相同”的比较问题,尤其适合不知道总体分布类型的场景。
一、基础铺垫:什么是“秩”?
“秩”是“数据的排序名次”。
(一)无结数据的秩(无重复数据)
-
定义:设样本X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是简单随机样本,对每个XiX_iXi,统计样本中“不超过XiX_iXi的数据个数”,记为RiR_iRi,RiR_iRi就是XiX_iXi的秩, XiX_iXi是第RiR_iRi个顺序统计量。令R=(R1,R2,⋯ ,Rn)R=(R_1,R_2,\cdots,R_n)R=(R1,R2,⋯,Rn),RRR称为秩统计量。
例:样本数据[2.36, 2.76, 3.14, 3.48],排序后是[2.36(1), 2.76(2), 3.14(3), 3.48(4)],所以它们的秩分别是1、2、3、4。 -
关键性质:
- 秩统计量R=(R1,R2,...,Rn)R=(R_1,R_2,...,R_n)R=(R1,R2,...,Rn)是均匀分布的,所有排列等可能(比如3个数据的秩,(1,2,3)、(1,3,2)等6种排列概率都是1/6);
- 单个秩RiR_iRi的期望E(Ri)=n+12E(R_i)=\frac{n+1}{2}E(Ri)=2n+1,方差Var(Ri)=(n+1)(n−1)12Var(R_i)=\frac{(n+1)(n-1)}{12}Var(Ri)=12(n+1)(n−1);
- 核心意义:秩的分布和总体分布无关!这也是非参数检验不依赖总体分布的关键原因。
(二)有结数据的秩(有重复数据)
-
结的定义:排序后相同的数据点组成一个“结”,重复数据的个数叫“结长”。
例:数据[3.8, 3.2, 1.2, 1.2, 3.4, 3.2, 3.2],排序后是[1.2,1.2,3.2,3.2,3.2,3.4,3.8],其中1.2是结长2的结,3.2是结长3的结。 -
处理方法:秩平均法
重复数据的秩不唯一,取它们“原本应有的名次的平均值”作为共同的秩。
公式:若第iii个结的结长为τi\tau_iτi,前i−1i-1i−1个结的总长度为∑k=1i−1τk\sum_{k=1}^{i-1}\tau_k∑k=1i−1τk,则该结的秩为:
ri=∑k=1i−1τk+1+τi2r_i = \sum_{k=1}^{i-1}\tau_k + \frac{1+\tau_i}{2}ri=k=1∑i−1τk+21+τi -
例:
样本数据[2,2,4,7,7,7,8,9,9,9,9,10],其中有6个结,结长分别为2、1、3、1、4、1:- 第一个结(2,2):原本名次1、2,秩=(1+2)/2=1.5;
- 第三个结(7,7,7):原本名次4、5、6,秩=(4+5+6)/3=5;
- 第五个结(9,9,9,9):原本名次8、9、10、11,秩=(8+9+10+11)/4=9.5;
最终秩结果:[1.5,1.5,3,5,5,5,7,9.5,9.5,9.5,9.5,12]
二、核心方法:秩和检验法(Wilcoxon秩和检验)
(一)检验场景
从两个总体F(x)F(x)F(x)和G(x)G(x)G(x)中分别抽样本X1,...,Xn1X_1,...,X_{n_1}X1,...,Xn1(容量n1n_1n1)和Y1,...,Yn2Y_1,...,Y_{n_2}Y1,...,Yn2(容量n2n_2n2),检验假设:
H0:F(x)=G(x)H_0: F(x)=G(x)H0:F(x)=G(x)(两个总体分布相同);H1:F(x)≠G(x)H_1: F(x)\neq G(x)H1:F(x)=G(x)(分布不同)。
(二)核心思想
如果H0H_0H0成立,两个样本本质来自同一总体,合并排序后,两个样本的秩应该“均匀混合”——不会出现一个样本的秩全是小值,另一个全是大值。因此,用“容量较小样本的秩和”作为统计量TTT,若TTT过大或过小,就拒绝H0H_0H0。
(三)检验步骤(小样本:n1,n2≤10n_1,n_2\leq10n1,n2≤10)
- 建立假设:H0H_0H0(分布相同)vs H1H_1H1(分布不同);
- 合并样本:将两个样本的所有数据合并,按从小到大排序;
- 统一编秩:对每个数据编秩,重复数据用秩平均法;
- 计算秩和TTT:取容量较小样本的所有秩之和(若n1=n2n_1=n_2n1=n2,取任意一个的秩和);
- 查临界值:给定α\alphaα,查秩和检验临界值表,得T1T_1T1(下界)和T2T_2T2(上界);
- 判断:若T1<T<T2T_1<T<T_2T1<T<T2,接受H0H_0H0;否则拒绝H0H_0H0。
(四)例
题目背景
两个总体F(x)F(x)F(x)和G(x)G(x)G(x)的样本:
XXX(n1=8n_1=8n1=8):[2.36, 3.14, 7.52, 3.48, 2.76, 5.43, 6.54, 7.41]
YYY(n2=6n_2=6n2=6):[4.38, 4.25, 6.54, 3.28, 7.21, 6.54]
检验H0:F(x)=G(x)H_0:F(x)=G(x)H0:F(x)=G(x),α=0.05\alpha=0.05α=0.05。
分步解答
-
合并样本并排序:
合并后14个数据:2.36, 2.76, 3.14, 3.28, 3.48, 4.25, 4.38, 5.43, 6.54, 6.54, 6.54, 7.21, 7.41, 7.52 -
统一编秩:
- 前8个数据无重复,秩依次为1-8;
- 第9-11个数据都是6.54(结长3),原本秩9、10、11,平均秩=(9+10+11)/3=10;
- 最后3个数据秩依次为12、13、14。
编秩结果如下表:
| 编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| X | 2.36 | 2.76 | 3.14 | - | 3.48 | - | - | 5.43 | 6.54 | - | - | - | 7.41 | 7.52 |
| Y | - | - | - | 3.28 | - | 4.25 | 4.38 | - | - | 6.54 | 6.54 | 7.21 | - | - |
| 秩 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 10 | 10 | 10 | 12 | 13 | 14 |
-
计算秩和TTT:
YYY样本容量较小(n2=6n_2=6n2=6),其秩为4、6、7、10、10、12,所以:
T=4+6+7+10+10+12=49T=4+6+7+10+10+12=49T=4+6+7+10+10+12=49 -
查临界值并判断:
查秩和检验表(α=0.05\alpha=0.05α=0.05,n1=8n_1=8n1=8,n2=6n_2=6n2=6),得T1=32T_1=32T1=32,T2=58T_2=58T2=58;
因为32<49<5832<49<5832<49<58,所以接受H0H_0H0,认为两个总体分布无显著差异。
(五)大样本近似(n1,n2>10n_1,n_2>10n1,n2>10)
当样本量超过10,秩和检验表不再适用,此时TTT近似服从正态分布:
T∼N(n1(n1+n2+1)2,n1n2(n1+n2+1)12)T \sim N\left( \frac{n_1(n_1+n_2+1)}{2}, \frac{n_1n_2(n_1+n_2+1)}{12} \right)T∼N(2n1(n1+n2+1),12n1n2(n1+n2+1))
构造U统计量(标准化):
U=T−n1(n1+n2+1)2n1n2(n1+n2+1)12∼N(0,1)U = \frac{T - \frac{n_1(n_1+n_2+1)}{2}}{\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}} \sim N(0,1)U=12n1n2(n1+n2+1)T−2n1(n1+n2+1)∼N(0,1)
拒绝域:∣U∣>u1−α/2|U|>u_{1-\alpha/2}∣U∣>u1−α/2(比如α=0.05\alpha=0.05α=0.05时,u0.975=1.96u_{0.975}=1.96u0.975=1.96)。
三、延伸方法1:符号检验法(配对样本)
(一)适用场景
配对样本的比较(比如同一组对象对两种产品的评分、同一对象实验前后的指标),且不满足正态分布(无法用t检验)。
例:N个品酒人对甲乙两种酒评分(XiX_iXi为甲酒评分,YiY_iYi为乙酒评分),检验“两种酒是否一样好”。
(二)核心思想
只关注“配对数据的差异符号”,不关注差异大小:
- 记Zi=Xi−YiZ_i=X_i-Y_iZi=Xi−Yi,若Zi>0Z_i>0Zi>0,记“+”(甲优于乙);Zi<0Z_i<0Zi<0,记“-”(乙优于甲);Zi=0Z_i=0Zi=0,记“0”(无差异);
- 若H0H_0H0(两种酒一样好)成立,“+”和“-”出现的概率均为1/2,n+n_+n+(“+”的个数)服从二项分布b(n,1/2)b(n,1/2)b(n,1/2)(n=n++n−n=n_++n_-n=n++n−,排除“0”的个数)。
(三)检验步骤
- 建立假设:H0H_0H0(两种酒一样好,θ=1/2\theta=1/2θ=1/2)vs H1H_1H1(θ≠1/2\theta\neq1/2θ=1/2);
- 计算符号:对每个配对数据算ZiZ_iZi,统计n+n_+n+(“+”数)、n−n_-n−(“-”数),n=n++n−n=n_++n_-n=n++n−;
- 小样本(n≤50n\leq50n≤50):查符号检验临界值表,得ccc和d=n−cd=n-cd=n−c,拒绝域n+≥cn_+\geq cn+≥c或n+≤dn_+\leq dn+≤d;
- 大样本(n>50n>50n>50):用正态近似,U=2n+−nn∼N(0,1)U=\frac{2n_+-n}{\sqrt{n}} \sim N(0,1)U=n2n+−n∼N(0,1),拒绝域∣U∣>u1−α/2|U|>u_{1-\alpha/2}∣U∣>u1−α/2。
四、延伸方法2:符号秩和检验法(配对样本,改进版)
(一)符号检验法的不足
只考虑差异的“符号”,忽略了差异的“大小”(比如Zi=10Z_i=10Zi=10和Zi=1Z_i=1Zi=1都记“+”,但差异程度不同)。符号秩和检验弥补了这一缺陷——同时考虑符号和差异大小。
(二)核心思想
- 计算配对差异Zi=Xi−YiZ_i=X_i-Y_iZi=Xi−Yi,排除Zi=0Z_i=0Zi=0的情况,剩余nnn个有效数据;
- 对∣Zi∣|Z_i|∣Zi∣(差异绝对值)编秩,重复数据用秩平均法;
- 定义符号秩和统计量W+W^+W+:所有Zi>0Z_i>0Zi>0的∣Zi∣|Z_i|∣Zi∣的秩之和;
- 若H0H_0H0成立,W+W^+W+不应过大或过小(因为Zi>0Z_i>0Zi>0和Zi<0Z_i<0Zi<0的概率相等,秩也应均匀分布)。
(三)检验步骤
- 建立假设:H0:F(x)=G(x)H_0:F(x)=G(x)H0:F(x)=G(x)(两种产品评价一致)vs H1:F(x)≠G(x)H_1:F(x)\neq G(x)H1:F(x)=G(x);
- 计算差异Zi=Xi−YiZ_i=X_i-Y_iZi=Xi−Yi,保留Zi≠0Z_i\neq0Zi=0的样本;
- 对∣Zi∣|Z_i|∣Zi∣编秩,处理结数据;
- 计算W+W^+W+:累加Zi>0Z_i>0Zi>0对应的秩;
- 小样本(n≤20n\leq20n≤20):查符号秩和检验临界值表,得ccc和d=n(n+1)2−cd=\frac{n(n+1)}{2}-cd=2n(n+1)−c,拒绝域W+≥cW^+\geq cW+≥c或W+≤dW^+\leq dW+≤d;
- 大样本(n>20n>20n>20):正态近似,E(W+)=n(n+1)4E(W^+)=\frac{n(n+1)}{4}E(W+)=4n(n+1),Var(W+)=n(n+1)(2n+1)24Var(W^+)=\frac{n(n+1)(2n+1)}{24}Var(W+)=24n(n+1)(2n+1),U=W+−E(W+)Var(W+)∼N(0,1)U=\frac{W^+-E(W^+)}{\sqrt{Var(W^+)}} \sim N(0,1)U=Var(W+)W+−E(W+)∼N(0,1),拒绝域∣U∣>u1−α/2|U|>u_{1-\alpha/2}∣U∣>u1−α/2。
(四)例
题目背景
13个用户对甲乙两种产品评分,检验“用户对两种产品评价是否一致”,α=0.10\alpha=0.10α=0.10。
| iii (用户) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| xix_ixi (甲) | 55 | 32 | 41 | 50 | 60 | 48 | 39 | 45 | 48 | 46 | 52 | 45 | 44 |
| yiy_iyi (乙) | 45 | 37 | 43 | 55 | 44 | 50 | 43 | 46 | 51 | 47 | 55 | 46 | 41 |
分步解答
- 计算差异Zi=Xi−YiZ_i=X_i-Y_iZi=Xi−Yi,并算∣Zi∣|Z_i|∣Zi∣:
比如用户1:X=55,Y=45X=55,Y=45X=55,Y=45,Z=10Z=10Z=10,∣Z∣=10|Z|=10∣Z∣=10;用户2:X=32,Y=37X=32,Y=37X=32,Y=37,Z=−5Z=-5Z=−5,∣Z∣=5|Z|=5∣Z∣=5; - 对∣Zi∣|Z_i|∣Zi∣编秩(处理结数据,比如∣Z∣=5|Z|=5∣Z∣=5出现3次,秩取平均);
- 计算W+W^+W+:只累加Z>0Z>0Z>0的秩,得W+=12+13+6.5=31.5W^+=12+13+6.5=31.5W+=12+13+6.5=31.5;
- 查临界值:n=13n=13n=13,α=0.10\alpha=0.10α=0.10,查表得c=74c=74c=74,d=13×142−74=17d=\frac{13×14}{2}-74=17d=213×14−74=17,拒绝域W+≥74W^+\geq74W+≥74或W+≤17W^+\leq17W+≤17;
- 判断:17<31.5<7417<31.5<7417<31.5<74,接受H0H_0H0,认为用户对两种产品评价无明显差异。
(五)例2
根据Wilcoxon符号秩检验,在显著性水平α=0.10\alpha=0.10α=0.10下,检验两种啤酒是否有显著差异。已知样本量n=100n=100n=100,乙种啤酒的正符号秩和W+=2200W^+ = 2200W+=2200。
在原假设(两种啤酒无差异)下,W+W^+W+的均值和方差分别为:
- 均值μ=n(n+1)4=100×1014=2525\mu = \frac{n(n+1)}{4} = \frac{100 \times 101}{4} = 2525μ=4n(n+1)=4100×101=2525
- 方差σ2=n(n+1)(2n+1)24=100×101×20124=84587.5\sigma^2 = \frac{n(n+1)(2n+1)}{24} = \frac{100 \times 101 \times 201}{24} = 84587.5σ2=24n(n+1)(2n+1)=24100×101×201=84587.5,标准差 σ≈290.84\sigma \approx 290.84σ≈290.84
计算标准化统计量:
Z=W+−μσ=2200−2525290.84≈−1.1175
Z = \frac{W^+ - \mu}{\sigma} = \frac{2200 - 2525}{290.84} \approx -1.1175
Z=σW+−μ=290.842200−2525≈−1.1175
双侧检验的临界值为z0.05=1.645z_{0.05} = 1.645z0.05=1.645。由于∣Z∣=1.1175<1.645|Z| = 1.1175 < 1.645∣Z∣=1.1175<1.645,不拒绝原假设。
因此,在α=0.10水平上,这两种啤酒的得分没有显著差异。
五、总结
3种基于“秩”或“符号”的非参数检验方法核心应用场景和区别如下:
| 方法 | 适用场景 | 核心特点 |
|---|---|---|
| 秩和检验法 | 两个独立样本,检验分布是否相同 | 基于合并样本的秩和,不依赖总体分布 |
| 符号检验法 | 配对样本,检验差异是否存在 | 只关注差异符号,简单但忽略差异大小 |
| 符号秩和检验法 | 配对样本,检验差异是否存在 | 同时关注符号和差异大小,更有效 |
关键点:
- 秩的核心性质:分布与总体无关,有结数据用秩平均法;
- 秩和检验的核心:合并编秩→算秩和→查临界值(小样本)或正态近似(大样本);
- 配对样本优先选符号秩和检验(比符号检验更充分利用数据信息)。
2万+

被折叠的 条评论
为什么被折叠?



