summarise函数和mutate函数的应用:计算分组占比实战
在R语言中,summarise函数和mutate函数是数据处理中非常常用的两个函数。summarise函数用于对数据进行汇总统计,而mutate函数则用于添加新的变量列到数据框中。本文将介绍如何使用summarise函数和mutate函数来计算分组占比,并给出相关源代码。
首先,我们需要准备一个包含待处理数据的数据框。假设我们有一个销售记录数据框,其中包含产品类别和销售数量两个变量。我们的目标是计算每个产品类别的销售数量占整体销售数量的比例。
下面是一个示例数据框:
sales_data <- data.frame(
product_category = c("A", "B", "A", "C", "B", "A", "C"),
sales_quantity = c(10, 20, 15, 5, 8, 12, 7)
)
我们可以使用dplyr包中的summarise函数和mutate函数来实现我们的目标。首先,我们需要加载dplyr包:
library(dplyr)
接下来,我们可以使用summarise函数和mutate函数来计算分组占比。首先,我们使用summarise函数对数据框进行分组汇总,计算每个产品类别的销售数量之和:
grouped_data <- sales_data %>%
group_by(pr