R语言读取CSV,将csv数据中的重复值进行统计,统计之后删除重复内容,只保留第一次出现的值。
rm(list = ls())
library(ggplot2)
library(dplyr)
Rstart=Sys.time()
setwd("G:/GISworkspace/Rprocess") #建立工作空间
df=read.csv('level3_river_clipV6.csv',header = T) #数据读取
Cname=data.frame(df$NAME_CH) #取需要处理的列
space=data.frame(1:lengths(Cname)) #建一个dataframe用于储存,这里是为了不破坏原数据
num=array(1:lengths(Cname)) #用于记录重复次数
for( i in 1:lengths(Cname)) #双循环
{
k=0
for (j in 1:lengths(Cname))
{
if(Cname[i,]==Cname[j,])
{
space[i,]=Cname[j,]
k=k+1
}
else
{k=k}
}
num[i]=k
}
#boole=1:lengths(space)
all=data.frame(space$X1.lengths.Cname.,num) #合并两个数据框
#all=data.frame(space$X1.lengths.Cname.,num,boole)
#all[,3]=duplicated(all[,2])
all=all%>%distinct(all$space.X1.lengths.Cname.