R: 矩阵运算及常用函数 III - *apply Part I

本文对比了R语言中for循环和*apply家族函数(如sapply)在处理数据时的效率,通过实例展示了apply函数的基本用法,包括计算矩阵的列均值、分组统计以及对环境变量的操作。此外,还介绍了tapply和by函数的用法,它们在数据分组处理上的应用。文章最后提到了eapply函数,并指出lapply、rapply和mapply将在后续讨论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在”矩阵运算及常用函数I“里已经提到过,apply系列函数“主要用于某维度上某函数/方法的批量应用”,可以避免“控制流循环带来的高错误率以及漫长的响应时间”。

为了比较响应时间,我们可以先做一个简单的测试:为一列数据做一一系列幂的变形,依据指数的sequence,生成一系列的新数据。然后用system.time()来测试运行的时间(如何解读system.time()结果)。
test1. for循环
> power1 <- function(var = EuStockMarkets[,1]){
+   new.var <- NULL
+   for(i in seq(.001, .999, .001)){
+     if(is.null(new.var)){
+       new.var <- var^i
+     }else{
+       new.var <- data.frame(new.var, var^i)
+     }
+  }

+  return(new.var)
+ }
> system.time(power1())
   user  system elapsed 
   1.06    0.00    1.08 
这里elapsed说明调用和运行程序到整体执行完一共花费的时间,这段循环的function花费了1.08秒

test2. sapply
> power2<-function(i)EuStockMarkets[,1]^i
> system.time(sapply(seq(.001,.999,.001),power2))
   user  system elapsed
   0.42    0.00    0.42 
这个地方, 当我们使用sapply进行处理的时候,总共消耗了0.42秒,比for循环快了一倍多,虽然只快了不到一秒,但是执行效率有相当大幅度的提升。当处理的维度变得原来越多的时候(比如for的循环嵌套),apply函数的优势就会更明显。

-+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+- -+-

在help system中搜索apply
> ??apply

可以看到在{base}中自带的跟apply相关的函数有7个:
base::apply Apply Functions Over Array Margins
base::by Apply a Function to a Data Frame Split by Factors
base::eapply Apply a Function Over Values in an Environment
base::lapply Apply a Function over a List or Vector
base::mapply Apply a Function to Multiple List or Vector Arguments
base::rapply Recursively Apply a Function to a List
base::tapply Apply a Function Over a Ragged Array

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值