22、相关性分析全面指南：从数据录入到各类系数计算

sprite

于 2025-09-20 12:47:05 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏：用R解锁统计学的魔法文章标签：相关性分析皮尔逊相关系数斯皮尔曼相关系数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sprite/article/details/154760669

用R解锁统计学的魔法专栏收录该内容

75 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

相关性分析全面指南：从数据录入到各类系数计算

1. 相关性分析的数据录入

在进行相关性、回归和多元回归分析时，数据录入相对直接，每个变量应录入到单独的列中。若使用 R 以外的软件准备数据，对于每个测量的变量，需在电子表格中创建一个具有适当名称的变量，并将参与者的分数录入到电子表格的一行中。若存在一个或多个分类变量（如性别），这些变量也可录入到列中。

例如，若要计算表 6.1 中两个变量的相关性，应按图 6.3 所示录入数据。可以看到，每个变量录入到单独的列中，每行代表一个个体的数据（如第一个消费者看到 5 个广告，购买了 8 包产品）。

如果数据集较小，可直接将变量录入到 R 中，然后从中创建数据框。以广告数据为例，可执行以下命令：

adverts<-c(5,4,4,6,8)
packets<-c(8,9,10,13,15)
advertData<-data.frame(adverts, packets)

自测

录入广告数据，并使用 ggplot2 绘制数据的散点图（y 轴为购买的包数，x 轴为观看的广告数）。

2. 双变量相关性

相关性分为双变量相关性和偏相关性。双变量相关性是指两个变量之间的相关性，而偏相关性则是在“控制”一个或多个额外变量的影响下，考察两个变量之间的关系。皮尔逊积矩相关系数、斯皮尔曼等级相关系数（Spearman’s rho）和肯德尔等级相关系数（Kendall’s tau）都是双变量相关系数的例子。

以考试成绩为例，一位心理学家对考试压力和复习

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。