3种相关分析

本文介绍了R语言中进行相关性分析的三种方法:皮尔逊相关(pearson)、斯皮尔曼相关(spearman)和肯德尔相关(kendall)。皮尔逊相关适用于线性关系且数据正态分布的情况,对离群值敏感;斯皮尔曼和肯德尔是非参数方法,对离群值不敏感,适合非线性关系。肯德尔相关在小样本或异常值存在时更稳健。选择相关性方法需考虑数据类型、线性关系和正态分布条件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

R里面做相关(library())的话,通常会见到这三种不同的相关方法,用不同的方法得出来的结果是不一样的,所以总结一下,什么时候该用什么方法。

pearson (皮尔逊相关)

spearman (斯皮尔曼相关)

kendall (肯德尔相关)

R:

library(dplyr)

stats_temp_k = pcor.test(X,Y, Z,method=“kendall”)# Z is the controlling varibles

Matlab:

一 、皮尔逊相关性

在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。

它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。这个相关系数也称作“皮尔逊积矩相关系数”。

定义

两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:

上式定义了总体相关系数,常用希腊小写字母

作为代表符号。估算样本的协方差和标准差,可得到皮尔逊相关系数,常用英文小写字母

代表:

亦可由

样本点的标准分数均值估计,得到与上式等价的表达式:

其中

分别是对

样本的标准分数、样本平均值和样本标准差。

相关系数<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

可爱的小垃圾

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值