R语言:常用apply函数(apply,tapply,sapply,lapply)用法介绍

apply函数

对矩阵、数据框、数组(二维、多维)等矩阵型数据,按行或列应用函数FUN进行循环计算,并以返回计算结果

apply(X, MARGIN, FUN, ...)
  • X:数组、矩阵、数据框等矩阵型数据
  • MARGIN: 按行计算或按按列计算,1表示按行,2表示按列
  • FUN: 自定义的调用函数

应用iris数据集进行举例,以下计算前四个变量的均值:

a <- apply(iris[,1:4], 2, mean)					#前四列数据,按列,求均值
a
# 输出
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
    5.843333     3.057333     3.758000     1.199333 

tapply函数

将数据按照不同方式分组,生成类似列联表形式的数据结果

tapply(X, INDEX, FUN = NULL, ..., default = NA, simplify = TRUE)
  • X:数组、矩阵、数据框等分割型数据向量
  • INDEX:一个或多个因子的列表,每个因子的长度都与x相同
  • FUN: 自定义的调用函数
manager <- c(1, 2, 3, 4, 5)
country <- c("US", "US", "UK", "UK", "UK")
gender <- c("M", "F", "F", "M", "F")
age <- c(32, 45, 25, 39, 99)
leadership <- data.frame(manager, country, gender, age)
tapply(leadership$age, leadership$country, mean)	# 求在不同country水平下的age的均值
# 输出
      UK       US 
54.33333 38.50000 

# 求在不同country和gender交叉水平下的age的均值, 输出得到矩阵数据
tapply(leadership$age, list(leadership$country, leadership$gender), mean)
# 输出
    F  M
UK 62 39
US 45 32

lapply函数

对列表、数据框数据集进行循环,输入为列表,返回值为列表

lapply(X, FUN, ...)
  • X:列表、数据框
  • FUN:自定义的调用函数
b <- list(x = 1:10, y = matrix(1:12, 3, 4))
b
# 输出
$x
 [1]  1  2  3  4  5  6  7  8  9 10

$y
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
lapply(b, sum)					# 求列表中各元素的和
# 输出
$x
[1] 55

$y
[1] 78

sapply函数

类似于lapply函数,但输入为列表,返回值为向量

sapply(X, FUN, ..., )
  • X:列表、矩阵、数据框
  • FUN:自定义的调用函数
sapply(b, sum)				# 求列表中各元素的和
# 输出
 x  y 
55 78 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值