R 语言相关性的度量
相关性是统计学中常用的概念,用于衡量两个变量之间的关联程度。在 R 语言中,我们可以使用多种方法来度量变量之间的相关性。本文将介绍一些常见的相关性度量方法,并提供相应的源代码示例。
- 皮尔逊相关系数
皮尔逊相关系数是衡量两个连续变量之间线性关系强度的常用方法。它的取值范围在 -1 到 1 之间,其中 1 表示完全正相关,-1 表示完全负相关,0 表示无相关性。
# 创建两个连续变量
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 6, 8, 10)
# 计算皮尔逊相关系数
cor(x, y)
- 斯皮尔曼相关系数
斯皮尔曼相关系数是一种非参数方法,用于度量两个变量之间的单调关系。它将原始数据转换为秩次,然后计算秩次之间的皮尔逊相关系数。斯皮尔曼相关系数的取值范围也在 -1 到 1 之间。
# 创建两个连续变量
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 6, 8, 10)
# 计算斯皮尔曼相关系数
cor(x, y, method = "spearman")
- 切比雪夫距离
切比雪夫距离是一种度量两个变量之间差异的方法。它计算两个变量之间在每个维度上的最大