【R语言】R语言常用函数：交集intersect、并集union、找不同setdiff、判断相同setequal

最新推荐文章于 2024-12-19 22:00:32 发布

原创最新推荐文章于 2024-12-19 22:00:32 发布 · 1.4w 阅读

47 ·

CC 4.0 BY-SA版权

文章标签：

#R语言 #交集 #并集 #差集 #判断相同

R语言与数据可视化专栏收录该内容

20 篇文章

订阅专栏

交集intersect、并集union、差集setdiff、判断相同setequal

在使用R语言进行生物信息数据分析的过程中，需要经常比较不同集合之间元素的共性和差异，所以需要使用到交集、并集、找不同、判断相同等操作。

交集：intersect

两个向量的交集，集合可以是数字、字符串等

# 两个数值向量取交集
intersect(x=1:4, y = 2:6)
# [1] 2 3 4

# 两个字符向量取交集
intersect(x=letters[1:4], y = letters[2:6])
# [1] "b" "c" "d"

# 混合向量
intersect(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))
[1] "a" "4"

并集：union

求两个向量的并集，集合可以是任何数值类型

# 两个数值向量取并集
union(x=1:4, y = 2:6)
# [1] 1 2 3 4 5 6

# 两个字符向量取并集
union(x=letters[1:4], y = letters[2:6])
# [1] "a" "b" "c" "d" "e" "f"

# 混合向量
union(x=c("a", "b", "c", 4), y = c("a", 2, 3, 4))
[1] "a" "b" "c" "4" "2" "3"

差集：setdiff

求向量x与向量y中不同的元素(只取x中不同的元素，即存在于向量x减去向量x与向量y的交集)
setdiff(x, y)

x = 1:4
y = 2:6
# 找x中不同于y的元素
setdiff(x, y)
# [1] 1
# 找y中不同于x的元素
setdiff(y, x)
# [1] 5 6

判断相同：setequal

x = 1:4
y = 2:6
# 判断x与y是否相同，结果为假
setequal(x, y)
# [1] FALSE
# 找y与x是否相同，结果为假
setequal(y, x)
# [1] FALSE

# 只有完全相同的才返回TRUE
y = 1:4
setequal(x, y)
# [1] TRUE

案例

# 两个字符向量
treeleaf <- as.vector(treeleaf)
treeotu <- as.vector(treeotu)
length(treeleaf)
length(treeotu)
# 取交集
intersect_res <- intersect(treeleaf,treeotu)
length(intersect_res)

#取并集
union_res <- union(treeleaf,treeotu)
length(union_res)

# 取差集
diff1 <- setdiff(treeotu,treeleaf)
length(diff1)
diff1

# 判断相同
equals_res <- setequal(treeotu,treeleaf)
equals_res