R语言 决策树–预测模型
决策树是一种常用的机器学习算法,用于构建预测模型。在R语言中,我们可以使用多个包来创建和分析决策树。本文将介绍如何在R语言中使用决策树算法构建预测模型,并提供相应的源代码。
- 准备数据集
首先,我们需要准备用于训练和测试的数据集。假设我们有一个包含特征和目标变量的数据集,其中特征用于预测目标变量。我们可以使用R语言中的数据框架(data.frame)来表示数据集。
# 创建数据集
data <- data.frame(
特征1 = c(1, 2, 3, 4, 5),
特征2 = c("A", "B", "C", "A", "B"),
目标变量 = c("Y", "N", "Y", "N", "Y")
)
- 安装和加载所需的包
在构建决策树之前,我们需要安装并加载R语言中的决策树包。在本例中,我们将使用rpart
包,该包提供了创建和分析决策树的功能。
# 安装包
install.packages("rpart")
# 加载包
library(rpart)
- 构建决策树模型
使用rpart
包,我们可以使用rpart()
函数构建决策树模型。该函数接受一个公式作为参数,其中包含特征和目标变量的关系。我们可以通过设置其他参数来调整模型的行为,例如设置树的最大深度(