【Python・统计学】斯皮尔曼相关分析(原理及代码)

本文介绍了斯皮尔曼相关分析的基本原理,它适用于非正态数据和等级数据,与皮尔逊相关比较,对异常值不敏感。通过Python示例展示了如何计算相关系数和p值,以判断教育程度与收入满意度的显著相关性。

前言

自学笔记,分享给对统计学原理不太清楚但需要在论文中用到的小伙伴,欢迎大佬们补充或绕道。ps:本文不涉及公式讲解(文科生小白友好体质)~(部分定义等来源于知乎)

本文重点:斯皮尔曼相关分析

1.斯皮尔曼相关分析的简单原理

2.斯皮尔曼相关分析和皮尔曼相关分析的区别

【3.斯皮尔曼相关分析代码

▷重要:相关关系不等于因果关系
 

1.斯皮尔曼相关分析的简单原理

斯皮尔曼相关检验(Spearman's rank correlation test)是一种非参数统计方法,用于衡量两个变量之间的单调关系强度和方向。与皮尔逊相关检验不同,斯皮尔曼相关检验不要求数据满足正态分布,对异常值也不敏感,适用于序数尺度或等级数据。

 关于“参数检验”和“非参数检验”的不同,请参考以下文章。【统计学】参数检验和非参数检验的区别和基本统计学

  1. 假设检验:斯皮尔曼相关检验的零假设(H0)是两个变量之间没有单调关系,即相关系数等于0;备择假设(H1)是两个变量之间存在单调关系,即相关系数不等于0。
  2. 将数据转换为秩次:将两个变量的数据分别按照从小到大的顺序排列,并将它们的位置(秩次)赋予相应的数值。如果有并列的数据,则取其平均秩次。
  3. 计算秩次相关系数:斯皮尔曼相关系数(ρ)的计算公式为: ρ = 1 - (6 * Σ(d^2)) / (n * (n^2 - 1)) 其中,d是两个变量秩次之差,n是样本量。
  4. 计算 p 值:根据样本量和相关系数,可以计算出 p 值,用于判断相关性的显著性水平。通常,如果 p 值小于显著性水平(
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值