使用 dplyr 进行数据转换
在数据处理和分析中,我们经常需要对数据进行各种操作,如选择变量、过滤行、分组数据、进行汇总统计等。 dplyr 包提供了一系列强大的函数,能够帮助我们高效地完成这些任务。本文将详细介绍 dplyr 包的常用函数及其使用方法。
1. 选择感兴趣的变量
当处理大型数据框时,我们通常只需要评估特定的变量。 select() 函数可以帮助我们选择和/或重命名变量。
例如,我们的目标是只评估最近五年的支出数据,可以使用以下代码:
sub_exp <- expenditures %>% select(Division, State, X2007:X2011)
head(sub_exp)
输出结果如下:
| Division | State | X2007 | X2008 | X2009 | X2010 | X2011 |
| — | — | — | — | — | — | — |
| 6 | Alabama | 6245031 | 6832439 | 6683843 | 6670517 | 6592925 |
| 9 | Alaska | 1634316 | 1918375 | 2007319 | 2084019 | 2201270 |
| 8 | Arizona | 7815720 | 8403221 | 8726755 | 8482552 | 8340211 |
| 7 | Arkansa
超级会员免费看
订阅专栏 解锁全文
809

被折叠的 条评论
为什么被折叠?



