#实例1
library(ISLR)
attach(Auto)
mpg01 = rep(0, length(mpg))
# mpg>median(mpg)会产生和length(mpg)相同长度的true/false
# 然后当做索引
mpg01[mpg>median(mpg)] = 1
Auto = data.frame(Auto, mpg01)
detach(Auto)
#实例2
glm.pred = rep(0, length(glm.probs))
# glm.probs > 0.5也是返回等长度的TRUE、FALSE
glm.pred[glm.probs > 0.5] = 1
mean(glm.pred != test$mpg01)
R语言中变量二值化方法
本文通过两个实例展示了如何使用R语言进行变量的二值化处理,即根据某个阈值将连续变量转换为二分类变量。首先利用`ISLR`包中的`Auto`数据集,将`mpg`变量基于其中位数转换为二分类变量;其次,根据预测概率大于0.5的原则,将预测结果转换为二分类形式,并与测试集中二分类`mpg`变量对比计算准确率。
324

被折叠的 条评论
为什么被折叠?



