R(五): R常用函数_r语言all.x-优快云博客

本文详细介绍了R语言中常用的数据处理函数，包括apply系列函数（apply、tapply、lapply、sapply）、数据合并函数merge，以及字符串操作函数（substr、substring、strsplit等）。通过对这些函数的深入解析及示例演示，帮助读者掌握R语言数据处理的核心技能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

工作笔记记录，会持续更新....

目录：

apply函数：

apply：apply的中文意思是应用，这个函数的意思是通过将一个函数应用到矩阵或数组中，返回一个向量或数组
语法：apply(X, MARGIN, FUN, ...) ，其中X为一个数组；MARGIN为一个向量（表示要将函数FUN应用到X的行还是列），1：表示取行，2：表示取列，c(1,2)表示行、列都计算。
示例：
View Code

tapply：

tapply：是对向量中的数据进行分组处理，而非对整体数据进行处理
语法： tapply(X, INDEX, FUN = NULL, ..., simplify = TRUE)，
1. 其中X通常是一向量；
2. INDEX是一个list对象，且该list中的每一个元素都是与X有同样长度的因子；
3. FUN是需要计算的函数；
4. simplify是逻辑变量，TRUE（默认值），且函数FUN的计算结果总是为一个标量值，那么函数tapply返回一个数组；若取值为FALSE，则函数tapply的返回值为一个list对象。需要注意的是，当第二个参数INDEX不是因子时，函数 tapply() 同样有效，因为必要时 R 会用 as.factor()把参数强制转换成因子
示例：
View Code

lapply:

lapply: （list apply）针对list的apply函数
语法: lapply(X, FUN, ...) lapply的返回值是和一个和X有相同的长度的list对象，这个list对象中的每个元素是将函数FUN应用到X的每一个元素
示例：
View Code
结果：$shop_id [1] 2 $saled [1] 56.5 $takeout_cost [1] 45 $delivery_time [1] 15

sapply：

sapply：sapply函数和Lapply函数类似，也是对List进行处理，只是在返回结果上，sapply会根据结果的数据类型和结构，重新构建一个合理的数据类型返回
语法：sapply(X, FUN,..., simplify = TRUE, USE.NAMES = TRUE)

示例：如上例，调用sapply函数返回结果为：

shop_id      saled  takeout_cost delivery_time 
2.0          56.5          45.0          15.0

merge:

substr、substring、strsplit、unlist、paste、paste0、nchar：

1. substr(x,start,stop) : 必须指定开始和结束位置
2. substring(text, first, last=1000000 ) ：substring()可以不用指定结束位置，默认为1000000，如果字符串的长度小于1000000，则默认为取到字符串的结尾处
3. 示例： substring("sinablog",5) 【blog】 substr("sinablog",5,10) 【blog]

strsplit、unlist:
1. strsplit(x, split, extended = TRUE, fixed = FALSE, perl = FALSE) x为待拆分的字符串向量，split拆分模式, fixed为TRUE表示精确匹配
2. 使用split函数得到的结果是一个列表，如果希望得到一个向量，可以使用unlist函数
3. 示例： unlist(strsplit("a.b.c", "\\.")) 结果：[1] "a" "b" "c"
nchar： 取字符长度，示例： x<-"sinablog" > nchar(x) 结果：[1] 8
paste、paste0：