《Cookbook for R》数据统计篇
相关性分析与线性回归
示例数据
# 生成一些数据
# X 呈增加趋势
# Z 呈增加趋势 (缓慢)
# Y 与 xvar 成反比,xvar*zvar 成正比
set.seed(955)
xvar <- 1:20 + rnorm(20,sd=3)
zvar <- 1:20/4 + rnorm(20,sd=2)
yvar <- -2*xvar + xvar*zvar/5 + 3 + rnorm(20,sd=4)
# 用这些变量生成一个数据框
dat <- data.frame(x=xvar, y=yvar, z=zvar)
# 看一下头几行
head(dat)
#> x y z
#> 1 -4.252354 4.5857688 1.89877152
#> 2 1.702318 -4.9027824 -0.82937359
#> 3 4.323054 -4.3076433 -1.31283495
#> 4 1.780628 0.2050367 -0.28479448
#> 5 11.537348 -29.7670502 -1.27303976
#> 6 6.672130 -10.1458220 -0.09459239
1、相关性分析
相关系数
cor(dat$x, dat$y)
#> [1] -0.7695378
相关性矩阵(适用于多个变量)
cor(dat)