使用R语言dplyr包中的summarise函数计算DataFrame数据中指定列的均值和中位数
在R语言中,dplyr包是一个强大的数据操作工具,它提供了一组简洁且直观的函数,用于对数据进行操作和转换。其中的summarise函数可以用于对数据进行汇总统计,包括计算均值、中位数等常见的统计量。本文将介绍如何使用dplyr包中的summarise函数计算DataFrame数据中指定列的均值和中位数。
首先,我们需要安装并加载dplyr包。可以使用以下命令进行安装:
install.packages("dplyr")
加载dplyr包:
library(dplyr)
接下来,我们需要创建一个DataFrame用于演示。假设我们有一个包含"age"和"income"两列的DataFrame,其中记录了一组人员的年龄和收入信息。以下是一个示例DataFrame的创建代码:
# 创建示例DataFrame
df <- data.frame(age = c(25, 30, 35, 40, 45),
income = c(50000, 60000, 70000, 80000, 90000))
现在我们有了一个名为df的DataFrame,其中包含了"age"和"income"两列的数据。我们可以使用summarise函数计算这两列数据的均值和中位数。以下是使用s
本文介绍了如何利用R语言中的dplyr包,特别是summarise函数,来计算DataFrame数据中特定列的均值和中位数。首先,安装并加载dplyr包,然后创建一个包含年龄和收入的DataFrame。通过summarise函数结合mean和median函数,可以轻松获取各列的统计结果。
订阅专栏 解锁全文
266

被折叠的 条评论
为什么被折叠?



