library(dplyr)
df <- tibble::tibble(
x = sample(10, 100, rep = TRUE),
y = sample(10, 100, rep = TRUE)
)
df
# 以全部列去重
distinct(df)
# 以列x去重,仅返回去重后的x列
distinct(df, x)
# 以列x去重,返回所有列
distinct(df, x, .keep_all = TRUE)
转自:# http://guangzheng.name/2017/10/08/dplyr%E5%8C%85%E4%B8%AD%E7%9A%84distinct%E5%87%BD%E6%95%B0/
本文介绍了如何使用dplyr库中的distinct函数进行数据去重,包括全列去重、按特定列x去重以及保留所有列的情况。通过实例演示了在R语言中实现数据去重的不同应用场景。
837

被折叠的 条评论
为什么被折叠?



