16、数据管理:缺失值处理与变量重命名

数据管理:缺失值处理与变量重命名

1. 缺失值处理

1.1 读取数据时指定缺失值

在读取数据时,可以通过 read.table 函数的 na.strings 参数指定哪些值应被视为缺失值。例如:

mydataNA <- read.table("mydataNA.txt", na.strings=c(".", "9", "99"))
mydataNA

这样,文件中出现的 . 9 99 都会被当作缺失值处理。

1.2 均值替换缺失值

当需要用均值替换缺失值时,由于直接对缺失值进行逻辑比较(如 q1==NA )不会得到 TRUE 结果,所以要使用 is.na 函数。示例代码如下:

attach(mydataNA)
mydataNA$q1[ is.na(q1) ] <- mean( q1, na.rm=TRUE )

此代码的操作步骤为:
1. 使用 attach(mydataNA) 方便使用短变量名简化代码。
2. 利用 is.na(q1) 找出 q1 中的缺失元素。
3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值