R语言数据处理与统计分析实用指南
1. 数据重编码
1.1 字符向量重编码
在数据处理中,我们常常需要对字符向量进行重编码。例如,将 “medium” 重编码为 “M”,”large” 重编码为 “L”。以下是具体的代码实现:
sizes[sizes=="medium"] <- "M"
sizes[sizes=="large"] <- "L"
sizes
运行上述代码后,输出结果为:
"S" "L" "L" "S" "M"
1.2 分类变量重编码为另一个分类变量
有时候,我们需要将一个分类变量重编码为另一个分类变量。以 PlantGrowth 数据集为例,我们将 group 变量重编码为 treatment 变量。
操作步骤如下:
1. 选取 PlantGrowth 数据集的子集:
pg <- PlantGrowth[c(1,2,11,21,22), ]
pg
- 使用
match()函数进行重编码:
pg <- PlantGrowth
oldvals <- c("ct
R语言数据处理与统计分析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



