使用R语言构建逻辑回归模型
逻辑回归是一种常用的分类算法,用于预测二分类问题。本文将使用R语言来构建逻辑回归模型,并提供相应的源代码。
首先,我们需要准备数据。逻辑回归要求输入数据是数值型的,因此我们需要对分类变量进行独热编码(one-hot encoding)。我们将使用一个示例数据集来说明整个过程。
# 导入所需的包
library(dplyr)
library(tidyr)
# 创建示例数据集
data <- data.frame(
age = c(25, 35, 45, 20, 30, 50, 55, 60),
gender = c("Male", "Female", "Male", "Female", "Male", "Male", "Female", "Male"),
income = c(50000, 60000, 70000, 30000, 40000, 90000, 80000, 70000),
default = c(0, 0, 1, 0, 1, 1, 1, 1)
)
# 对gender进行独热编码
data <- data %>%
mutate(
male = ifelse(gender == "Male", 1, 0),
female = ifelse(gender ==