R语言计算相关系数时出现NA的原因

最新推荐文章于 2023-07-13 10:42:36 发布

Sarah945

最新推荐文章于 2023-07-13 10:42:36 发布

阅读量3.5k

点赞数 1

文章标签： r语言开发语言

本文链接：https://blog.youkuaiyun.com/weixin_41796972/article/details/130920662

版权

先了解一下相关性计算公式：
相关性系数R=协方差/两个变量标准差的乘积
R中公式 cor(x,y) = cov(x,y)/(sd(x)*sd(y))

R语言计算相关系数时出现NA的原因一般有两个：

数据中有NA值

> > x <- c(1,2,3)
> y <- c(4,NA,4)
> cor(x,y)
[1] NA
> cov(x,y)/(sd(x)*sd(y))
[1] NA

用于计算相关性的两个向量中至少有一个标准差为0（向量中元素均为同样值时sd=0），导致计算相关系数R时分母为0，进而导致R计算为NA。

#正常情况
> x <- c(1,2,3)
> y <- c(5,5,6)
> sd(x)
[1] 1
> sd(y)
[1] 0.5773503
> cor(x,y)
[1] 0.8660254
> cov(x,y)/(sd(x)*sd(y))
[1] 0.8660254

#有一个标准差为0的情况

> x <- c(1,2,3)
> y <- c(4,4,4)
> sd(x)
[1] 1
> sd(y)
[1] 0
> cor(x,y)
[1] NA
Warning message:
In cor(x, y) : 标准差为零
> cov(x,y)/(sd(x)*sd(y))
[1] NaN

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Sarah945

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用R语言的for循环批量计算相关系数

TechRoar的博客

08-19

595

在这段代码中，我们首先创建了一个空的相关系数矩阵（cor_matrix），它的行数和列数都等于数据框中变量的数量。然后，我们使用两个嵌套的for循环来遍历数据框中的每对变量。在R语言中，我们可以使用for循环来批量计算多个变量之间的相关系数。在每次循环迭代中，我们使用cor()函数来计算当前变量对的相关系数，并将结果存储在相关系数矩阵的相应位置。最后，我们打印相关系数矩阵，以查看每对变量之间的相关系数。由于我们在示例数据框中的变量之间存在完全的线性关系，因此相关系数的值都接近于1。

R计算两列数据的相关系数_相关系数简介及R计算

weixin_39710003的博客

11-21

8503

变量间Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相关系数简介及R计算对于给定数据集中，变量之间的关联程度以及关系的方向，常通过相关系数衡量。就关系的强度而言，相关系数的值在+1和-1之间变化，值±1表示变量之间存在完美关联程度，即完全相关时绝对值为1；随着相关系数值趋于0，意味着变量之间的关系将减...

1 条评论您还未登录，请先登录后发表或查看评论

R语言计算相关系数时出现NA的解决办法

qq_52651584的博客

11-22

7051

R语言计算相关系数时出现NA时使用na.omit去除缺失值

7.R语言取数组元素出现NA的一种可能原因 A.K.A. R语言的括号与运算优先级的一个教训

Rilkean Heart

12-26

1610

问题描述哎呀坑死了谁能想到取数组元素出现NA是因为没加括号 for(i in 1：len*len) #这种情况是错误的！！ for(i in 1：(len*len)) #这种情况就对了！！多么痛的领悟 QAQ 我再也不省括号了 ...

pearsonr报错：计算结果为nan、warning .warn (stats.constantinputwarning (msg))

weixin_63016274的博客

07-13

2839

警告的具体内容 "ConstantInputWarning" 表示输入的变量在整个数据集中都是常数，也就是说没有变异性。在计算 Pearson 相关系数时，这样的常数输入变量会导致分母为零，从而无法进行计算。在这种情况下，警告是由于计算 Pearson 相关系数时出现了常数输入变量（constant input variables）。经过检查：发现模型不管输入什么输出的预测结果都是一样的，所以导致了pearsonr 无法计算出结果。解决：再次训练，注意relu的使用位置，同时使用其他的激活函数替代。

R中scan()出现NA？

Y-A-M

04-13

1576

a <- scan("3.17.txt",sep="\t")使用该命令，由于数据的不完整，会出现缺失值NA，如果继续进行ts()操作，在acf()过程中，会有错误。所以出现该问题主要是scan命令中的sep="\t",使用该设置，会读取完整的数据，包括缺失数据，去掉该设置，问题就可以解决。...

r语言dmy()函数转化出现na_R语言从入门到精通：Day5

weixin_39928106的博客

10-21

751

是时候关注我们一波了经过前面几次推文的学习，相信大家对R语言已经有了一个大概的了解，同时也初步感受了R语言在数据处理领域的强大功能，不过实话实说，前面的内容还只是R语言应用的冰山一角而已。从这次推文开始，我们就要正式开始接触R语言对数据处理的强大能力。在正文内容开始之前，我先给大家推荐一个文档https://google.github.io/styleguide/Rguide.xml相信...

weixin_39821035的博客

11-21

3376

weixin_39842682的博客

11-20

4336

R语言也是目前常用的数据分析编程语言之一，目前经过使用者、科学家们的开发，其功能也比较强大。本文就使用R语言中的corrplot来绘制相关系数矩阵热图进行介绍。下面以波士顿Boston的房价数据为例，这个数据是数据挖掘、机器学习中常用的数据，可以到UCI的机器学习数据库去下载：https://archive.ics.uci.edu/ml/machine-learning-databases/hou...

R语言——相关系数矩阵可视化（大全）

qq_41969000的博客

04-22

1万+

相关系数分析在很多领域都有涉及，而可视化则是对其结果最好的体现。

R中的NA与NULL值

weixin_66015161的博客

10-23

2349

在R的很多统计函数中，如果存在NA值，会影响mean()等函数的计算，相比之下，R会自动跳过空值NULL，并不会影响其计算。

R语言回归结果中有NA

a8131357leo的博客

04-25

1万+

线性回归模型中 lm() . glm() 某些变量的结果为 NA 说明这个变量与其他变量线性相关，可能是一个，也可能是有很多个，所以有 .... 所以当你包含V3 的时候 MLE会有无数个解，所以只能drop掉他生成模型一句化：多重共线性的毛病 ...

R语言入门——NA、NAN、Inf（缺失值的识别）

统计学小王子的博客

04-19

2万+

目录00引言1、Inf2、NAN（Not a Number）3、NA与逻辑运算符4、总结 00引言这篇的主角是R语言中缺失值(NA)的识别与提取。先介绍NAN、Inf及其运算。在最终介绍缺失值（NA），毕竟重要的都压轴嘛。 1、Inf 在实数轴上除了确定的有限点，还有两个无限：正无穷、负无穷。用Inf、-Inf表示。 > Inf [1] Inf > -Inf [1] -Inf &gt...

python 相关系数及其存在的问题

ustbbsy的博客

03-06

2154

R语言中缺失值NA的处理