数据处理与层次化数据格式探索
数据框操作与不同工具实现
R语言中的数据框操作
在R语言中,我们可以使用管道操作对数据框进行一系列处理。以下是一个示例代码,用于筛选、选择列、分组、聚合、排序并取前5条记录:
summary <- data %>%
filter(x > y+1) %>% # Predicate selection of rows
select(name, x) %>% # Selection of columns
group_by(name) %>% # Grouping
# Aggregation and naming
summarize(Mean_x = mean(x)) %>%
arrange(Mean_x) %>% # Sort data
head(5) # First 5
summary
上述代码的操作步骤如下:
1. filter(x > y+1) :筛选出 x 大于 y + 1 的行。
2. select(name, x) :选择 name 和 x 两列。
3. group_by(name) :按 name
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



