[秩相关] Spearman秩相关系数计算及假设检验

本文介绍Spearman秩相关系数的概念及其计算方法,并通过实例对比了它与Pearson相关系数的区别。Spearman秩相关系数适用于非参数检验,能够衡量变量间的单调关系强度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先说明秩相关系数还有其他类型,比如kendal秩相关系数。

使用Pearson线性相关系数有2个局限:

  1. 必须假设数据是成对地从正态分布中取得的。
  2. 数据至少在逻辑范围内是等距的。

对于更一般的情况有其他的一些解决方案,Spearman秩相关系数就是其中一种。Spearman秩相关系数是一种无参数(与分布无关)检验方法,用于度量变量之间联系的强弱。在没有重复数据的情况下,如果一个变量是另外一个变量的严格单调函数,则Spearman秩相关系数就是+1或-1,称变量完全Spearman秩相关。注意这和Pearson完全相关的区别,只有当两变量存在线性关系时,Pearson相关系数才为+1或-1。

对原始数据xi,yi按从大到小排序,记x'i,y'i为原始xi,yi在排序后列表中的位置,x'i,y'i称为xi,yi的秩次,秩次差di=x'i-y'i。Spearman秩相关系数为:

           

位置原始X排序后秩次原始Y排序后秩次秩次差
112546517861
2546451784610
31332424551
44513246620
5321236241
62264513-3

对于上表数据,算出Spearman秩相关系数为:1-6*(1+1+1+9)/(6*35)=0.6571

如果原始数据中有重复值,则在求秩次时要以它们的平均值为准,比如:

原始X秩次调整后的秩次
0.855
1.24(4+3)/2=3.5
1.23(4+3)/2=3.5
2.322
1811

假设检验:

Spearman秩相关系数也应该进行假设检验,当n小于等于50时,用查表法,当n大于50时,计算统计量t的值,即用前面皮尔森相关系数假设检验中t值的计算方式。


对于上述数据,查阅秩相关系数检验的临界值表

n显著水平
0.050.01
50.91
60.8290.943
70.7140.893

置信度=1-显著水平。上表显示在n=6的时候,当spearman秩相关系数>=0.829时我们有95%的置信度认为两个随机变量相关,当spearman秩相关系数>=0.943时我们有99%的置信度认为两个随机变量相关。由于0.6571<0.829,即置信度达不到95%,所以我们不能认为X和Y相关。


实例:



### 回答1: Spearman相关系数检验是一种非参数检验方法,用于评估两个变量之间的相关性。它不需要对数据的分布做出任何假设,适用于非正态分布的数据。Spearman相关系数检验的基本思想是将两个变量的所有观测值按从小到大的顺序排列,然后用秩次替代原始数据值,再计算秩和统计量。通过比较统计量与临界值,可以判断两个变量之间是否存在显著相关性。 Spearman相关系数检验的假设是,两个变量之间没有相关性,即零假设为ρ=0。如果计算出的Spearman相关系数显著不等于零,则拒绝零假设,认为两个变量之间存在相关性。 ### 回答2: Spearman相关系数检验是一种非参数的假设检验方法,用于评估两个变量之间的相关性。它是根据两个变量的等级(而不是数值)来计算相关系数。 Spearman相关系数的取值范围是-1到1,其中1表示两个变量完全正相关,-1表示两个变量完全负相关,0表示两个变量之间没有线性相关性。 Spearman相关系数检验的步骤如下: 1. 首先,将每个变量的观测值按照大小进行排名,并分别记下排名。 2. 然后,计算出每个观测值的排名差值,并计算出这些差值的平方和。 3. 接下来,使用公式计算Spearman相关系数,公式为1- (分子/分母),其中分子是每个排名差值的平方和,分母是n(样本量)的平方减去1。 4. 最后,使用临界值表或p值来判断计算出的Spearman相关系数是否在统计意义上显著。 Spearman相关系数检验可以适用于非正态分布的数据和有序变量,因此在某些情况下比皮尔逊相关系数更为适用。然而,它也有一些限制,例如不能检验非线性关系和敏感度较低。 总结而言,Spearman相关系数检验是一种用于评估两个变量之间非线性相关性的检验方法,适用于非正态分布的数据和有序变量。 ### 回答3: Spearman相关系数是用于衡量两个变量之间的相关性的一种非参数检验方法。它基于变量的等级或秩次而不依赖于变量的具体数值。 Spearman相关系数通过比较两组数据的秩次来判断它们之间的关联程度。秩次是指将数据按照从小到大的顺序排列,并赋予它们一个对应的秩次。如果两个变量的秩次分别相对应,则它们之间具有完全的正相关性。 Spearman相关系数的取值范围在-1到1之间。当相关系数为1时,表示两个变量之间存在完全的正相关关系;当相关系数为-1时,表示两个变量之间存在完全的负相关关系;当相关系数为0时,表示两个变量之间不存在线性关系。 进行Spearman相关系数检验需要先计算出每个变量的秩次,然后计算秩次之间的差值,并将其平方求和。最终的统计量服从t分布,通过查找t分布表可以确定其显著性水平。检验的假设为原假设:两个变量之间不存在相关性。如果计算得到的Spearman相关系数小于0.05的显著性水平,则拒绝原假设,认为两个变量之间存在显著相关性。 Spearman相关系数检验在许多领域都有广泛应用,特别是在统计学和社会科学研究中。由于它不要求数据满足特定的分布前提,因此适用于各种类型的数据。而且,它对异常值相对较稳健,所以在存在异常值的情况下也能给出可靠的结果。因此,Spearman相关系数检验在分析数据相关性时是一种常用且有效的方法。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值