数据管理:缺失值处理与变量重命名
1. 缺失值处理
1.1 读取数据时指定缺失值
在读取数据时,可以通过 read.table
函数的 na.strings
参数指定哪些值应被视为缺失值。例如:
mydataNA <- read.table("mydataNA.txt", na.strings=c(".", "9", "99"))
mydataNA
这样,文件中出现的 .
、 9
和 99
都会被当作缺失值处理。
1.2 均值替换缺失值
当需要用均值替换缺失值时,由于直接对缺失值进行逻辑比较(如 q1==NA
)不会得到 TRUE
结果,所以要使用 is.na
函数。示例代码如下:
attach(mydataNA)
mydataNA$q1[ is.na(q1) ] <- mean( q1, na.rm=TRUE )
此代码的操作步骤为:
1. 使用 attach(mydataNA)
方便使用短变量名简化代码。
2. 利用 is.na(q1)
找出 q1
中的缺失元素。
3