R里的逻辑索引

R语言中变量二值化方法

最新推荐文章于 2023-12-29 14:24:12 发布

原创最新推荐文章于 2023-12-29 14:24:12 发布 · 1.1k 阅读

0 ·

CC 4.0 BY-SA版权

R 专栏收录该内容

2 篇文章

订阅专栏

本文通过两个实例展示了如何使用R语言进行变量的二值化处理，即根据某个阈值将连续变量转换为二分类变量。首先利用`ISLR`包中的`Auto`数据集，将`mpg`变量基于其中位数转换为二分类变量；其次，根据预测概率大于0.5的原则，将预测结果转换为二分类形式，并与测试集中二分类`mpg`变量对比计算准确率。

#实例1
library(ISLR)
attach(Auto)
mpg01 = rep(0, length(mpg))
# mpg>median(mpg)会产生和length(mpg)相同长度的true/false
# 然后当做索引
mpg01[mpg>median(mpg)] = 1
Auto = data.frame(Auto, mpg01)
detach(Auto)

#实例2
glm.pred = rep(0, length(glm.probs))
# glm.probs > 0.5也是返回等长度的TRUE、FALSE
glm.pred[glm.probs > 0.5] = 1
mean(glm.pred != test$mpg01)