非参数统计基础2——秩和检验

非参数统计基础2——秩和检验

秩和检验是除Person外另一类核心非参数方法,包括它的衍生方法(符号检验、符号秩和检验)。秩和检验的核心用来解决“两个总体分布是否相同”的比较问题,尤其适合不知道总体分布类型的场景。

一、基础铺垫:什么是“秩”?

“秩”是“数据的排序名次”。

(一)无结数据的秩(无重复数据)

  1. 定义:设样本X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是简单随机样本,对每个XiX_iXi,统计样本中“不超过XiX_iXi的数据个数”,记为RiR_iRiRiR_iRi就是XiX_iXi的秩, XiX_iXi是第RiR_iRi个顺序统计量。令R=(R1,R2,⋯ ,Rn)R=(R_1,R_2,\cdots,R_n)R=(R1,R2,,Rn)RRR称为秩统计量。
    例:样本数据[2.36, 2.76, 3.14, 3.48],排序后是[2.36(1), 2.76(2), 3.14(3), 3.48(4)],所以它们的秩分别是1、2、3、4。

  2. 关键性质

    • 秩统计量R=(R1,R2,...,Rn)R=(R_1,R_2,...,R_n)R=(R1,R2,...,Rn)是均匀分布的,所有排列等可能(比如3个数据的秩,(1,2,3)、(1,3,2)等6种排列概率都是1/6);
    • 单个秩RiR_iRi的期望E(Ri)=n+12E(R_i)=\frac{n+1}{2}E(Ri)=2n+1,方差Var(Ri)=(n+1)(n−1)12Var(R_i)=\frac{(n+1)(n-1)}{12}Var(Ri)=12(n+1)(n1)
    • 核心意义:秩的分布和总体分布无关!这也是非参数检验不依赖总体分布的关键原因。

(二)有结数据的秩(有重复数据)

  1. 结的定义:排序后相同的数据点组成一个“结”,重复数据的个数叫“结长”。
    例:数据[3.8, 3.2, 1.2, 1.2, 3.4, 3.2, 3.2],排序后是[1.2,1.2,3.2,3.2,3.2,3.4,3.8],其中1.2是结长2的结,3.2是结长3的结。

  2. 处理方法:秩平均法
    重复数据的秩不唯一,取它们“原本应有的名次的平均值”作为共同的秩。
    公式:若第iii个结的结长为τi\tau_iτi,前i−1i-1i1个结的总长度为∑k=1i−1τk\sum_{k=1}^{i-1}\tau_kk=1i1τk,则该结的秩为:
    ri=∑k=1i−1τk+1+τi2r_i = \sum_{k=1}^{i-1}\tau_k + \frac{1+\tau_i}{2}ri=k=1i1τk+21+τi


  3. 样本数据[2,2,4,7,7,7,8,9,9,9,9,10],其中有6个结,结长分别为2、1、3、1、4、1:

    • 第一个结(2,2):原本名次1、2,秩=(1+2)/2=1.5;
    • 第三个结(7,7,7):原本名次4、5、6,秩=(4+5+6)/3=5;
    • 第五个结(9,9,9,9):原本名次8、9、10、11,秩=(8+9+10+11)/4=9.5;
      最终秩结果:[1.5,1.5,3,5,5,5,7,9.5,9.5,9.5,9.5,12]

二、核心方法:秩和检验法(Wilcoxon秩和检验)

(一)检验场景

从两个总体F(x)F(x)F(x)G(x)G(x)G(x)中分别抽样本X1,...,Xn1X_1,...,X_{n_1}X1,...,Xn1(容量n1n_1n1)和Y1,...,Yn2Y_1,...,Y_{n_2}Y1,...,Yn2(容量n2n_2n2),检验假设:
H0:F(x)=G(x)H_0: F(x)=G(x)H0:F(x)=G(x)(两个总体分布相同);H1:F(x)≠G(x)H_1: F(x)\neq G(x)H1:F(x)=G(x)(分布不同)。

(二)核心思想

如果H0H_0H0成立,两个样本本质来自同一总体,合并排序后,两个样本的秩应该“均匀混合”——不会出现一个样本的秩全是小值,另一个全是大值。因此,用“容量较小样本的秩和”作为统计量TTT,若TTT过大或过小,就拒绝H0H_0H0

(三)检验步骤(小样本:n1,n2≤10n_1,n_2\leq10n1,n210

  1. 建立假设:H0H_0H0(分布相同)vs H1H_1H1(分布不同);
  2. 合并样本:将两个样本的所有数据合并,按从小到大排序;
  3. 统一编秩:对每个数据编秩,重复数据用秩平均法;
  4. 计算秩和TTT:取容量较小样本的所有秩之和(若n1=n2n_1=n_2n1=n2,取任意一个的秩和);
  5. 查临界值:给定α\alphaα,查秩和检验临界值表,得T1T_1T1(下界)和T2T_2T2(上界);
  6. 判断:若T1<T<T2T_1<T<T_2T1<T<T2,接受H0H_0H0;否则拒绝H0H_0H0

(四)例

题目背景

两个总体F(x)F(x)F(x)G(x)G(x)G(x)的样本:
XXXn1=8n_1=8n1=8):[2.36, 3.14, 7.52, 3.48, 2.76, 5.43, 6.54, 7.41]
YYYn2=6n_2=6n2=6):[4.38, 4.25, 6.54, 3.28, 7.21, 6.54]
检验H0:F(x)=G(x)H_0:F(x)=G(x)H0:F(x)=G(x)α=0.05\alpha=0.05α=0.05

分步解答
  1. 合并样本并排序
    合并后14个数据:2.36, 2.76, 3.14, 3.28, 3.48, 4.25, 4.38, 5.43, 6.54, 6.54, 6.54, 7.21, 7.41, 7.52

  2. 统一编秩

    • 前8个数据无重复,秩依次为1-8;
    • 第9-11个数据都是6.54(结长3),原本秩9、10、11,平均秩=(9+10+11)/3=10;
    • 最后3个数据秩依次为12、13、14。
      编秩结果如下表:
编号1234567891011121314
X2.362.763.14-3.48--5.436.54---7.417.52
Y---3.28-4.254.38--6.546.547.21--
12345678101010121314
  1. 计算秩和TTT
    YYY样本容量较小(n2=6n_2=6n2=6),其秩为4、6、7、10、10、12,所以:
    T=4+6+7+10+10+12=49T=4+6+7+10+10+12=49T=4+6+7+10+10+12=49

  2. 查临界值并判断
    查秩和检验表(α=0.05\alpha=0.05α=0.05n1=8n_1=8n1=8n2=6n_2=6n2=6),得T1=32T_1=32T1=32T2=58T_2=58T2=58
    因为32<49<5832<49<5832<49<58,所以接受H0H_0H0,认为两个总体分布无显著差异。

(五)大样本近似(n1,n2>10n_1,n_2>10n1,n2>10

当样本量超过10,秩和检验表不再适用,此时TTT近似服从正态分布:
T∼N(n1(n1+n2+1)2,n1n2(n1+n2+1)12)T \sim N\left( \frac{n_1(n_1+n_2+1)}{2}, \frac{n_1n_2(n_1+n_2+1)}{12} \right)TN(2n1(n1+n2+1),12n1n2(n1+n2+1))
构造U统计量(标准化):
U=T−n1(n1+n2+1)2n1n2(n1+n2+1)12∼N(0,1)U = \frac{T - \frac{n_1(n_1+n_2+1)}{2}}{\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}} \sim N(0,1)U=12n1n2(n1+n2+1)T2n1(n1+n2+1)N(0,1)
拒绝域:∣U∣>u1−α/2|U|>u_{1-\alpha/2}U>u1α/2(比如α=0.05\alpha=0.05α=0.05时,u0.975=1.96u_{0.975}=1.96u0.975=1.96)。

三、延伸方法1:符号检验法(配对样本)

(一)适用场景

配对样本的比较(比如同一组对象对两种产品的评分、同一对象实验前后的指标),且不满足正态分布(无法用t检验)。
例:N个品酒人对甲乙两种酒评分(XiX_iXi为甲酒评分,YiY_iYi为乙酒评分),检验“两种酒是否一样好”。

(二)核心思想

只关注“配对数据的差异符号”,不关注差异大小:

  • Zi=Xi−YiZ_i=X_i-Y_iZi=XiYi,若Zi>0Z_i>0Zi>0,记“+”(甲优于乙);Zi<0Z_i<0Zi<0,记“-”(乙优于甲);Zi=0Z_i=0Zi=0,记“0”(无差异);
  • H0H_0H0(两种酒一样好)成立,“+”和“-”出现的概率均为1/2,n+n_+n+(“+”的个数)服从二项分布b(n,1/2)b(n,1/2)b(n,1/2)n=n++n−n=n_++n_-n=n++n,排除“0”的个数)。

(三)检验步骤

  1. 建立假设:H0H_0H0(两种酒一样好,θ=1/2\theta=1/2θ=1/2)vs H1H_1H1θ≠1/2\theta\neq1/2θ=1/2);
  2. 计算符号:对每个配对数据算ZiZ_iZi,统计n+n_+n+(“+”数)、n−n_-n(“-”数),n=n++n−n=n_++n_-n=n++n
  3. 小样本(n≤50n\leq50n50):查符号检验临界值表,得cccd=n−cd=n-cd=nc,拒绝域n+≥cn_+\geq cn+cn+≤dn_+\leq dn+d
  4. 大样本(n>50n>50n>50):用正态近似,U=2n+−nn∼N(0,1)U=\frac{2n_+-n}{\sqrt{n}} \sim N(0,1)U=n2n+nN(0,1),拒绝域∣U∣>u1−α/2|U|>u_{1-\alpha/2}U>u1α/2

四、延伸方法2:符号秩和检验法(配对样本,改进版)

(一)符号检验法的不足

只考虑差异的“符号”,忽略了差异的“大小”(比如Zi=10Z_i=10Zi=10Zi=1Z_i=1Zi=1都记“+”,但差异程度不同)。符号秩和检验弥补了这一缺陷——同时考虑符号和差异大小。

(二)核心思想

  1. 计算配对差异Zi=Xi−YiZ_i=X_i-Y_iZi=XiYi,排除Zi=0Z_i=0Zi=0的情况,剩余nnn个有效数据;
  2. ∣Zi∣|Z_i|Zi(差异绝对值)编秩,重复数据用秩平均法;
  3. 定义符号秩和统计量W+W^+W+:所有Zi>0Z_i>0Zi>0∣Zi∣|Z_i|Zi的秩之和;
  4. H0H_0H0成立,W+W^+W+不应过大或过小(因为Zi>0Z_i>0Zi>0Zi<0Z_i<0Zi<0的概率相等,秩也应均匀分布)。

(三)检验步骤

  1. 建立假设:H0:F(x)=G(x)H_0:F(x)=G(x)H0:F(x)=G(x)(两种产品评价一致)vs H1:F(x)≠G(x)H_1:F(x)\neq G(x)H1:F(x)=G(x)
  2. 计算差异Zi=Xi−YiZ_i=X_i-Y_iZi=XiYi,保留Zi≠0Z_i\neq0Zi=0的样本;
  3. ∣Zi∣|Z_i|Zi编秩,处理结数据;
  4. 计算W+W^+W+:累加Zi>0Z_i>0Zi>0对应的秩;
  5. 小样本(n≤20n\leq20n20):查符号秩和检验临界值表,得cccd=n(n+1)2−cd=\frac{n(n+1)}{2}-cd=2n(n+1)c,拒绝域W+≥cW^+\geq cW+cW+≤dW^+\leq dW+d
  6. 大样本(n>20n>20n>20):正态近似,E(W+)=n(n+1)4E(W^+)=\frac{n(n+1)}{4}E(W+)=4n(n+1)Var(W+)=n(n+1)(2n+1)24Var(W^+)=\frac{n(n+1)(2n+1)}{24}Var(W+)=24n(n+1)(2n+1)U=W+−E(W+)Var(W+)∼N(0,1)U=\frac{W^+-E(W^+)}{\sqrt{Var(W^+)}} \sim N(0,1)U=Var(W+)W+E(W+)N(0,1),拒绝域∣U∣>u1−α/2|U|>u_{1-\alpha/2}U>u1α/2

(四)例

题目背景

13个用户对甲乙两种产品评分,检验“用户对两种产品评价是否一致”,α=0.10\alpha=0.10α=0.10

iii (用户)12345678910111213
xix_ixi (甲)55324150604839454846524544
yiy_iyi (乙)45374355445043465147554641
分步解答
  1. 计算差异Zi=Xi−YiZ_i=X_i-Y_iZi=XiYi,并算∣Zi∣|Z_i|Zi
    比如用户1:X=55,Y=45X=55,Y=45X=55,Y=45Z=10Z=10Z=10∣Z∣=10|Z|=10Z=10;用户2:X=32,Y=37X=32,Y=37X=32,Y=37Z=−5Z=-5Z=5∣Z∣=5|Z|=5Z=5
  2. ∣Zi∣|Z_i|Zi编秩(处理结数据,比如∣Z∣=5|Z|=5Z=5出现3次,秩取平均);
  3. 计算W+W^+W+:只累加Z>0Z>0Z>0的秩,得W+=12+13+6.5=31.5W^+=12+13+6.5=31.5W+=12+13+6.5=31.5
  4. 查临界值:n=13n=13n=13α=0.10\alpha=0.10α=0.10,查表得c=74c=74c=74d=13×142−74=17d=\frac{13×14}{2}-74=17d=213×1474=17,拒绝域W+≥74W^+\geq74W+74W+≤17W^+\leq17W+17
  5. 判断:17<31.5<7417<31.5<7417<31.5<74接受H0H_0H0,认为用户对两种产品评价无明显差异。

(五)例2

根据Wilcoxon符号秩检验,在显著性水平α=0.10\alpha=0.10α=0.10下,检验两种啤酒是否有显著差异。已知样本量n=100n=100n=100,乙种啤酒的正符号秩和W+=2200W^+ = 2200W+=2200

在原假设(两种啤酒无差异)下,W+W^+W+的均值和方差分别为:

  • 均值μ=n(n+1)4=100×1014=2525\mu = \frac{n(n+1)}{4} = \frac{100 \times 101}{4} = 2525μ=4n(n+1)=4100×101=2525
  • 方差σ2=n(n+1)(2n+1)24=100×101×20124=84587.5\sigma^2 = \frac{n(n+1)(2n+1)}{24} = \frac{100 \times 101 \times 201}{24} = 84587.5σ2=24n(n+1)(2n+1)=24100×101×201=84587.5,标准差 σ≈290.84\sigma \approx 290.84σ290.84

计算标准化统计量:
Z=W+−μσ=2200−2525290.84≈−1.1175 Z = \frac{W^+ - \mu}{\sigma} = \frac{2200 - 2525}{290.84} \approx -1.1175 Z=σW+μ=290.84220025251.1175
双侧检验的临界值为z0.05=1.645z_{0.05} = 1.645z0.05=1.645。由于∣Z∣=1.1175<1.645|Z| = 1.1175 < 1.645Z=1.1175<1.645,不拒绝原假设。

因此,在α=0.10水平上,这两种啤酒的得分没有显著差异。

五、总结

3种基于“秩”或“符号”的非参数检验方法核心应用场景和区别如下:

方法适用场景核心特点
秩和检验法两个独立样本,检验分布是否相同基于合并样本的秩和,不依赖总体分布
符号检验法配对样本,检验差异是否存在只关注差异符号,简单但忽略差异大小
符号秩和检验法配对样本,检验差异是否存在同时关注符号和差异大小,更有效

关键点

  1. 秩的核心性质:分布与总体无关,有结数据用秩平均法;
  2. 秩和检验的核心:合并编秩→算秩和→查临界值(小样本)或正态近似(大样本);
  3. 配对样本优先选符号秩和检验(比符号检验更充分利用数据信息)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值