merge

本文介绍了R语言中数据操作的关键函数,包括merge用于类似SQL的JOIN操作来连接数据框,subset用于选择特定条件的数据子集,split用于按指定因素划分数据,以及unique用于去除重复项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

函数功能2:

       merge:可以将两个dataFrame连接在一起,和数据库中sql语句JOIN很相似。Dataframe a(with columns x, y, z) and b (with columns x1, x2, y,z)可以生成新的Dataframe c(with columns x, y, z, x1, x2).

              merge(x, y, all.x = TRUE) # LEFT JOIN
              merge(x, y, all.y = TRUE) # RIGHT JOIN
              merge(x, y, all = TRUE) # OUTER JOIN

              merge(a, b, by=c("y", "z"))

 

       subset:从matrix,dataframe中选择合适的数据集。

              subset(x, name=='abc', age>20, select=c(id, department, age))

 

split(x, f, drop=FALSE, …):可以将vector或者data frame划分为list.

         x : vector 或者data frame

         f : factor, 定义分组

         drop : 如果为TRUE,则在factor中没有出现的元素将被丢弃

Example:

For vector:

         x<-c(1:10)

         f <-factor (c(1,2,3,4,2,3,6,3,2, 7 ))

         Split(x, f)的结果是:

         ‘1’: 1

           ‘2’: 2, 5, 9

           ‘3’: 3, 6, 8

           ‘4’: 4

           ‘6’: 7

           ‘7’: 10

 

  For data frame:

         split(da, col(da)): 将data frame da按照列分开

         split(ma, ma$x): 将data frame ma按照x列中出现的元素分成多份,每份中x列的值都是相同的。

 

unique(x, incomparable=FALSE, fromlast=FALSE): 可以将vector, data frame, array中相同的行去掉

         x: vector, data frame, array

         incomparable: 是否能被比较

         fromlast: 是否从后往前比

(注:不能按照某一列unique这个data frame)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值