tidyverse —— forcats包

最新推荐文章于 2025-05-20 13:32:10 发布

原创

最新推荐文章于 2025-05-20 13:32:10 发布 · 2.8k 阅读

5 ·

CC 4.0 BY-SA版权

本文介绍了R语言tidyverse包中的forcats包，用于处理因子。包括如何生成因子、调序和修改因子水平。示例中详细展示了如何使用fct_reorder、fct_recode和fct_collapse等函数进行操作，以便于数据可视化和清理。

640?wx_fmt=gif

作者简介

野菜团子，R语言中文社区专栏作者

博客：https://ask.hellobi.com/blog/esperanca

forcats包用于处理因子，可以更高效地对因子进行修改。

1. 生成因子

R语言的base包中函数如dataframe等默认因子在分类变量读入时就会生成，而tidyverse包中的readr等包则会保留数据读入时的原样不做改变，要生成因子则可以使用parse_factor函数进行处理。parse_factor函数更审慎一些，会对不在给定的因子水平中的变量取值一个警告，而base包中的factor则会直接将该值记为NA，不给出报错或警告。

x <- c("Dec", "Apr","Jam", "Mar")

month_levels <- c(

"Jan", "Feb", "Mar","Apr", "May", "Jun", "Jul","Aug", "Sep", "Oct", "Nov","Dec"

)

y <- parse_factor(x, levels = month_levels)

如下图，x中的“Jam”不在给定的因子水平中，所以返回一个警告。

640?wx_fmt=png