R语言去重复数据

本文介绍了如何使用R语言中的duplicated函数来去除数据框中的重复数据。通过具体实例展示了如何删掉所有列中完全重复的数据,以及如何选择性地删除部分列中重复的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本次总结来源网络,有多处参考

在R语言中,去掉重复数据的函数是:duplicated

删掉所有列中数据一样的:

>test <- data.frame(
  x1 = c(1,2,3,4,5,1,3,5),
  x2 = c("a","b","c","d","e","a","b","e"),
  x3 = c("a","b","c","d","e","a","c","e"))
> test
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
6  1  a  a
7  3  b  c
8  5  e  e

> test[!duplicated(test),] #删掉所有列上都重复的
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
7  3  b  c

选择性的删除重复的

> test[!duplicated(test[,c(2,3)]),]
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
7  3  b  c
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值