随机森林分类和决策树的对比

最新推荐文章于 2025-05-13 11:31:22 发布

小梓菡

最新推荐文章于 2025-05-13 11:31:22 发布

阅读量1.9k

点赞数

CC 4.0 BY-SA版权

文章标签：决策树 python 机器学习算法

本文链接：https://blog.youkuaiyun.com/xiaokeaiuiya/article/details/108865267

本文探讨了随机森林分类与决策树的区别，通过交叉验证和for循环比较两者性能。并研究了随机森林中最佳树木数量，利用代码表示组合求和公式，展示森林中树的随机值选择。此外，还解释了37%的袋外数据概念，并介绍了随机森林分类接口的使用。强调在构建随机森林前，需确保单棵决策树的预测准确率至少为50%。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

%matplotlib inline
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_wine

wine = load_wine()
wine.data  # 特征矩阵，不能为一维，要和标签分开导入
wine.target  # 标签，必须为一维，要和特征矩阵分开导入

from sklearn.model_selection import train_test_split
Xtrain,Xtest,Ytrain,Ytest = train_test_split(wine.data,wine.target,test_size=0.3)

clf = DecisionTreeClassifier(random_state=0) # 实例化
rfc = RandomForestClassifier(random_state=0) # 实例化
clf = clf.fit(Xtrain,Ytrain)   # 训练集带入实例化后的模型去进行训练，使用的接口是fit
rfc = rfc.fit(Xtrain,Ytrain)   # 训练集带入实例化后的模型去进行训练，使用的接口是fit
score_c = clf.score(Xtest,Ytest)# 使用其他接口score将测试集导入我们训练好的模型，去获取我们希望获取的结果（score、Y_test）
score_r = rfc.score(Xtest,Ytest)# 使用其他接口score将测试集导入我们训练好的模型，去获取我们希望获取的结果（score、Y_test）

print('Single Tree:{}'