Bagging随机森林

本文探讨了Bagging(袋装法)的原理,如何通过有放回抽样降低模型方差,增强稳定性。介绍了随机森林在与决策树的交叉验证效果对比,以及`n_estimators`参数的学习曲线。同时,提到了oob_score(袋外得分),它是评估模型性能的一种方式,尤其是在数据量有限时,有效利用未参与建模的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Bagging(袋装法)

  • 又称自主聚集(bootstrap aggregating)是一种根据均匀概率分布从数据集中重复抽样(有放回)的技术。
  • 新数据可能有重复的值,而原始数据集中的某些样本可能根本没有出现在新数据集中
    在这里插入图片描述
  • 降低方差,提高模型整体的稳定性
  • 在这里插入图片描述
  • max_features 最多用多少特征进行分支,可以控制深度

min_samples_split 一个叶子最少样本数

import matplotlib.pyplot as plt
import matplotlib


#一颗决策树
from sklearn.tree import DecisionTreeClassifier

#集成森林
from sklearn.ensemble import RandomForestClassifier

#导入红酒数据
from sklearn.datasets import load_wine

wine = load_wine()

print(wine.data)
print(wine.target)

切分训练集和测试集

from sklearn.model_selection import train_test_split

Xtrain,Xtest,Ytrain,Ytest=train_test_split(wine.data,wine.target,test_size=0.3)


 #一棵树
clf = DecisionTreeClassifier(random_state=0)
clf = clf.fit(Xtrain,Ytrain)
#森林
rfc=RandomForestClass
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值