使用R语言构建列联表
前言:
在统计学和数据分析中,列联表(Contingency Table)是一种用来展示两个或多个分类变量之间关系的数据表。它通过交叉分类的方式,将不同分类变量的取值组合成网格,可以帮助我们观察和分析变量之间的相互关系。在R语言中,我们可以简单地使用一些函数和包来构建列联表和进行相应的分析。本文将介绍如何使用R语言构建列联表,并展示相应的代码实现。
- 准备数据
为了演示构建列联表的过程,我们首先需要准备一份实际的数据集。假设我们正在研究某个医疗调查中的两个变量:性别(Gender)和健康状况(Health)。我们收集到了100个人的数据,他们的性别和健康状况被记录在一个数据框中。下面是模拟的数据:
# 创建数据框
df <- data.frame(
Gender = sample(c("Male", "Female"), 100, replace = TRUE),
Health = sample(c("Healthy", "Unhealthy"), 100, replace = TRUE)
)
# 查看前几行数据
head(df)
- 构建列联表
在R语言中,我们可以使用table()
函数来构建列联表。该函数接受两个或多个变量作为参数,并返回一个交叉分类的频数统计表。对于我们的数据集,我们可以通过以下代码构建性别和健康状况之间的列联表:
# 构建列联表
ct <- table(d