数据重塑:长宽数据转换【基于tidyr】

在这里插入图片描述

在数据分析和可视化过程中,数据的组织形式直接影响着我们能够进行的分析类型和可视化效果。这里简单介绍两种常见的数据格式:长格式(Long Format)和宽格式(Wide Format),以及如何使用tidyr包进行转换。

什么是长格式和宽格式数据?

宽格式(Wide Format)

  • 每个观测单位占用一行
  • 每个变量占用一列
  • 适合人类直观阅读
  • 常见于Excel表格

例如,一个记录学生各科成绩的宽格式数据:

# 宽格式数据示例
student_scores_wide <- data.frame(
  student_id = c(1, 2, 3),
  math = c(85, 92, 78),
  english = c(92, 88, 95),
  science = c(90, 85, 88)
)

长格式(Long Format)

  • 每个观测值占用一行
  • 包含标识变量和值变量
  • 适合统计分析和可视化
  • 符合"整洁数据"原则

同样的数据在长格式下的表现:

# 长格式数据示例
student_scores_long <- data.frame(
  student_id = rep(1:3, each = 3),
  subject = rep(c("math", "english", "science"), 3),
  score = c(85, 92, 90, 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值