决策树模型的超参数、构建、解释与可视化
1. 决策树模型的超参数
决策树模型中有许多超参数,部分用于控制模型过拟合,部分用于提高模型准确性。重要超参数可参考表 1。
参数作用 | 描述 |
---|---|
控制过拟合 | 部分超参数可限制决策树的生长,避免模型对训练数据过度拟合 |
提高准确性 | 部分超参数可调整决策树的结构,使模型更准确地预测数据 |
2. 创建决策树模型
接下来创建两个决策树模型 dt1
和 dt2
,并验证训练集和测试集的准确率。
- dt1
:无最大深度限制,可能会过拟合。
- dt2
:最大深度限制为 3,可避免过拟合。
import sklearn.tree as tree
# 创建 dt1 模型
dt1 = tree.DecisionTreeClassifier()
dt1.fit(xtrain, ytrain)
print(dt1.score(xtrain, ytrain))
print(dt1.score(xtest, ytest))
# 创建 dt2 模型
dt2 = tree.Decisio