R数据科学(dplyr)
如今数据分析如火如荼,R
与Python
大行其道。你还在用Excel整理数据么,你还在用spss整理数据么。
数据分析的基础:Data Clean
数据清洗是数据处理的必备工作,而且往往需要花费大量时间去整理,去提取想要的数据,因为画图,报表都需要特定格式的数据。
EXCEL缺点:
- 数据粘贴复制,导致存在很多副本,更改都不知道原来数据有没有被改动
- 数据排序,计算,鼠标点击,容易误操作。
- 忘记保存,白费时间
- 效率低,时间长
现在,我们将学习对处理数据有用的两个软件包:
- dplyr是用于简化表格数据操作的软件包。
- tidyr使您可以在不同的数据格式之间快速转换。
两个软件包中的命令都可以与管道函数(%>%
)很好地配合使用,这可以使代码更具可读性。详细内容可参考