dplyr有五个核心函数:
| 函数 | 功能 |
| filter() | 对值筛选观测 |
| arrange() | 对行进行重新排列 |
| select() | 按名称选取变量 |
| mutate() | 使用现有变量的函数创建变量 |
| summarize() | 对多这个值总结为一个摘要统计量 |
| group_by() | 可以改变以上每个函数的作用范围 |
步骤:第一个参数数据框→输入变量名(描述数据要进行的操作)→输出数据框
filter()和arrange()函数还挺像的。filter函数,可以筛选值。而arrange函数可以改变行的顺序。
filter结合表达式用超棒!
arrange可以改变行的顺序。而且还可以结合一些函数使用,比如desc(),实现按列降序排列,desc的位置要在arrange函数里面哦
相比于前两个函数,select函数就是arrange的升级版,arrange函数即使实现了改变行的顺序的功能,但是如果没有被指定改变的,还会在输出的时候看到。但select不一样,select函数选择几列就是几列。可以指定几列,也可以从几列到几列,用":",甚至还可以反着选。select搭配一些函数使用起来也是非常棒的。

本文介绍了R语言中的dplyr包,重点讲解了filter、arrange、select、mutate和summarize五个核心函数的用法。filter用于筛选数据,arrange可按特定顺序排列行,select则用于选择特定列。mutate用于添加新列,summarize能将数据折叠并进行分组计算。结合group_by函数,可以实现对数据的深入分析。
最低0.47元/天 解锁文章
15

被折叠的 条评论
为什么被折叠?



