R语言读取CSV,删除重复行,进行数据分析

R语言读取CSV,将csv数据中的重复值进行统计,统计之后删除重复内容,只保留第一次出现的值。

rm(list = ls())
library(ggplot2)
library(dplyr)

Rstart=Sys.time()

setwd("G:/GISworkspace/Rprocess")     #建立工作空间

df=read.csv('level3_river_clipV6.csv',header = T)  #数据读取

Cname=data.frame(df$NAME_CH) #取需要处理的列

space=data.frame(1:lengths(Cname))   #建一个dataframe用于储存,这里是为了不破坏原数据

num=array(1:lengths(Cname))         #用于记录重复次数

for( i in 1:lengths(Cname))           #双循环
{
  k=0
  for (j in 1:lengths(Cname)) 
  
  {
    if(Cname[i,]==Cname[j,])
    {
      space[i,]=Cname[j,]
      k=k+1
    }
    else
    {k=k}
  }
  num[i]=k
}

#boole=1:lengths(space)

all=data.frame(space$X1.lengths.Cname.,num)        #合并两个数据框


#all=data.frame(space$X1.lengths.Cname.,num,boole)     
#all[,3]=duplicated(all[,2])

all=all%>%distinct(all$space.X1.lengths.Cname.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值