使用R语言中的dplyr包中的union
函数可以将两个数据框(dataframe)合并起来,并显示两个表中的所有行,同时从组合数据集中移除重复记录。下面我将详细介绍如何使用该函数,并提供相应的源代码示例。
在使用union
函数之前,需要先安装并加载dplyr包。可以通过以下代码安装dplyr包并加载它:
# 安装dplyr包
install.packages("dplyr")
# 加载dplyr包
library(dplyr)
假设我们有两个数据框df1
和df2
,它们包含相同的列名和相同的列顺序。现在我们想将这两个数据框合并,并移除重复的记录。下面是一个示例代码:
# 创建示例数据框df1
df1 <- data.frame(
ID = c(1, 2, 3),
Name = c("John", "Alice", "Bob"),
Age = c(25, 30, 35)
)
# 创建示例数据框df2
df2 <- data.frame(
ID = c(4, 2, 5),
Name = c("Tom", "Alice", "Mike"),