前言
自学笔记,分享给对统计学原理不太清楚但需要在论文中用到的小伙伴,欢迎大佬们补充或绕道。ps:本文不涉及公式讲解(文科生小白友好体质)~(部分定义等来源于知乎)
本文重点:斯皮尔曼相关分析
【1.斯皮尔曼相关分析的简单原理】
【2.斯皮尔曼相关分析和皮尔曼相关分析的区别】
【3.斯皮尔曼相关分析代码】
▷重要:相关关系不等于因果关系
1.斯皮尔曼相关分析的简单原理
斯皮尔曼相关检验(Spearman's rank correlation test)是一种非参数统计方法,用于衡量两个变量之间的单调关系强度和方向。与皮尔逊相关检验不同,斯皮尔曼相关检验不要求数据满足正态分布,对异常值也不敏感,适用于序数尺度或等级数据。
关于“参数检验”和“非参数检验”的不同,请参考以下文章。【统计学】参数检验和非参数检验的区别和基本统计学
- 假设检验:斯皮尔曼相关检验的零假设(H0)是两个变量之间没有单调关系,即相关系数等于0;备择假设(H1)是两个变量之间存在单调关系,即相关系数不等于0。
- 将数据转换为秩次:将两个变量的数据分别按照从小到大的顺序排列,并将它们的位置(秩次)赋予相应的数值。如果有并列的数据,则取其平均秩次。
- 计算秩次相关系数:斯皮尔曼相关系数(ρ)的计算公式为: ρ = 1 - (6 * Σ(d^2)) / (n * (n^2 - 1)) 其中,d是两个变量秩次之差,n是样本量。
- 计算 p 值:根据样本量和相关系数,可以计算出 p 值,用于判断相关性的显著性水平。通常,如果 p 值小于显著性水平(

本文介绍了斯皮尔曼相关分析的基本原理,它适用于非正态数据和等级数据,与皮尔逊相关比较,对异常值不敏感。通过Python示例展示了如何计算相关系数和p值,以判断教育程度与收入满意度的显著相关性。
最低0.47元/天 解锁文章
7131

被折叠的 条评论
为什么被折叠?



