tidyr包是R语言中一个重要的数据整理和清洗工具,它提供了一系列函数,能够帮助我们有效地处理和转换数据集。本文将介绍tidyr包的常用函数及其使用方法,并提供相应的源代码示例。
- gather()函数
gather()函数可以将数据从"宽格式"转换为"长格式"。在宽格式的数据中,每一列代表一种变量,而在长格式的数据中,每一行代表一个观察值。下面是一个使用gather()函数的示例:
# 创建一个宽格式的数据集
data <- data.frame(
id = 1:3,
A = c(10, 20, 30),
B = c(40, 50, 60),
C = c(70, 80, 90)
)
# 使用gather()函数将数据转换为长格式
tidy_data <- gather(data, key = "variable", value = "value", -id)
在上面的示例中,我们使用gather()函数将data数据集中的A、B和C列转换为两列:variable和value。其中,variable列存储原始数据集中的列名,value列存储对应列的数值。-id表示不对id列进行转换。
- spread()函数
spread()函数与gather()函数相反,它可以将数据从"长格式"转换为"宽格式"。下面是一个使用spread()函数的示例:
# 创建一个长格式的数据集
tidy_data <- data.frame(
本文介绍了R语言tidyr包的核心功能,包括gather()将数据从宽格式转为长格式,spread()反之,separate()用于拆分列,unite()则合并列。这些工具方便了数据清洗和整理,便于后续分析。
订阅专栏 解锁全文
1075





