使用R语言进行逻辑回归预测天猫优惠券使用情况
逻辑回归是一种常用的分类算法,可以用于预测二元变量的结果。在本篇文章中,我们将使用R语言来构建一个逻辑回归模型,预测顾客是否会使用天猫优惠券。
首先,我们需要准备数据集。假设我们有一个包含以下几个变量的数据集:年龄、性别、收入水平和是否使用天猫优惠券。我们的目标是根据其他变量的信息来预测顾客是否会使用天猫优惠券。
接下来,我们将使用R语言的逻辑回归函数glm()
来构建模型。下面是完整的代码:
# 读取数据集
data <- read.csv("data.csv")
# 查看数据集的结构和摘要
str(data)
summary(data)
# 将数据集分为训练集和测试集
set.seed(123)
train_indices <- sample(1:nrow(data), 0.7 * nrow(data))
train_data <- data[train_indices, ]
test_data <- data[-train_indices, ]
# 构建逻辑回归模型
model <- glm(使用天猫优惠券 ~ ., data = train_data, family = "binomial")
# 对测试集进行预测
predictions <- predict(model, newdata = test_data, type = "response")
# 将概率转换为类别
predicted_classes <- ifelse(predictions > 0.5, "是", "否")
# 计算准确率
a