| ####### Some dplyr | |
| library(dplyr) | |
| install.packages("hflights") | |
| library(hflights) | |
| flights<- as.data.frame(hflights) | |
| ### Filter function#### | |
| filter(flights, UniqueCarrier %in% c("AA", "UA")) | |
| ### Select##### | |
| select(flights, DepTime, ArrTime, FlightNum) | |
| select(flights, Year:DayofMonth, contains("Taxi")) | |
| ### Select and Filter##### | |
| flights %>% | |
| select(UniqueCarrier, DepDelay) %>% | |
| filter(DepDelay >60) | |
| ### arrange##### | |
| flights %>% | |
| select(UniqueCarrier, DepDelay) %>% | |
| arrange(desc(DepDelay)) | |
| ### Mutate##### | |
| flights<- flights %>% | |
| mutate(speed = Distance/AirTime*60) | |
| ### Summarise##### | |
| n() | |
| n_distinct() | |
R语言的dplyr应用
最新推荐文章于 2025-02-07 14:10:40 发布
本文深入探讨了R语言中dplyr包的使用技巧,通过实例展示了如何进行数据清洗、转换和聚合操作,提升数据分析效率。同时,文章也提及了dplyr与机器学习(ML)结合的应用,阐述了在预处理数据阶段的重要作用。

最低0.47元/天 解锁文章
352

被折叠的 条评论
为什么被折叠?



