merge

转载于 2013-04-06 09:29:38 发布 · 692 阅读

·

0

·

R 专栏收录该内容

8 篇文章

订阅专栏

本文介绍了R语言中数据操作的关键函数，包括merge用于类似SQL的JOIN操作来连接数据框，subset用于选择特定条件的数据子集，split用于按指定因素划分数据，以及unique用于去除重复项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

函数功能2：

merge：可以将两个dataFrame连接在一起，和数据库中sql语句JOIN很相似。Dataframe a(with columns x, y, z) and b (with columns x1, x2, y,z)可以生成新的Dataframe c(with columns x, y, z, x1, x2).

              merge(x, y, all.x = TRUE) # LEFT JOIN
              merge(x, y, all.y = TRUE) # RIGHT JOIN
              merge(x, y, all = TRUE) # OUTER JOIN

merge(a, b, by=c("y", "z"))

subset：从matrix，dataframe中选择合适的数据集。

subset(x, name=='abc', age>20, select=c(id, department, age))

split(x, f, drop=FALSE, …)：可以将vector或者data frame划分为list.

x : vector 或者data frame

f : factor, 定义分组

drop : 如果为TRUE，则在factor中没有出现的元素将被丢弃

Example:

For vector:

x<-c(1:10)

f <-factor (c(1，2，3，4，2，3，6，3，2, 7 ))

Split(x, f)的结果是：

‘1’: 1

‘2’: 2, 5, 9

‘3’: 3, 6, 8

‘4’: 4

‘6’: 7

‘7’: 10

For data frame:

split(da, col(da)): 将data frame da按照列分开

split(ma, ma$x): 将data frame ma按照x列中出现的元素分成多份，每份中x列的值都是相同的。

unique(x, incomparable=FALSE, fromlast=FALSE): 可以将vector, data frame, array中相同的行去掉

x: vector, data frame, array

incomparable: 是否能被比较

fromlast: 是否从后往前比

（注：不能按照某一列unique这个data frame）

博客等级

码龄13年

44
原创

46
点赞

97
收藏

32
粉丝

关注

私信

热门文章

分类专栏

datamining 9篇
eclipse
hadoop 1篇
hive 5篇
linux 4篇
mahout
mysql
python 1篇
R 8篇
RHadoop 1篇
sqoop
svn
ubuntu 3篇
工具 1篇
软件工程 1篇
读书笔记 3篇
stat
ccms分析系统 5篇
生活 2篇
draft

展开全部收起

上一篇：: 缺失值处理

下一篇：: R语言convesio of json files to csv or R data format

最新评论

Rstudio画图问题
马克图布Ontheroad: 什么意思啊可以详细说说嘛
KNN算法理解
ZhuNian的学习乐园: https://blog.youkuaiyun.com/qq_41709378/article/details/105386111
残差residual VS 误差 error
ticket_123 回复数据分析师之家: 我也感觉不太对。我的理解是，看模型是否合适，要看残差；看样本是否合适，要看误差。
残差residual VS 误差 error
SmartasU: 残差不够随机的话，能证明代入的模型不够好，不能最好的解释这些数据。另一方面来讲，也可能是这些数据经过了处理，导致残差出现不符合“预期”的情况。残差和越大，说明数据中包含的不可预测波动越大，和所取样本是否合适是不是关系不太大。毕竟得看是什么类型的数据，可以这样理解吗。理解来自：https://www.jianshu.com/p/c9022affd8b9
残差residual VS 误差 error
数据分析大神回复数据分析师之家: 对吧

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。