1、R中重复值的处理
unique函数作用:把数据结构中,行相同的数据去除。
#导入CSV数据
data <- read.csv('1.csv', fileEncoding = "UTF-8", stringsAsFactors = FALSE);
#对重复数据去重
new_data <- unique(data)
重复值处理函数:unique,用于清洗数据中的重复值。
“dplyr”包中的distinct() 函数更强大:
distinct(df,V1,V2) 根据V1和V2两个条件来进行去重
unique()是对整个数据框进行去重,而distinct()可以针对某些列进行去重。
2、R中缺失值的处理
缺失值的产生
①有些信息暂时无法获取
②有些信息被遗漏或者错误处理了