bagging算法思想
bagging集成当中、通常是并行建立多个弱评估器(通常是决策树),综合多个弱评估器的结果,按照少数服从多数的思想进行结果筛选。
准备工作、导入库
import numpy as np
import pandas as pd
import sklearn
import matplotlib as mlp
import seaborn as sns
import re, pip, conda
版本 sklearn 1.0.1 matplotlib 3.4.3 numpy 1.20.3 pandas 1.3.4 seaborn 0.11.2 pip 21.3.1 conda 4.10.3
随机森林RandomForest
从提供的数据中随机抽样出不同的子集,用于建立多棵不同的决策树,并按照Bagging的规则对单棵决策树的结果进行集成(回归则平均,分类则少数服从多数)
随机森林回归树参数
class
sklearn.ensemble.RandomForestRegressor
(n_estimators=100, *, criterion='squared_error', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, min_impurity_decrease=0.0, bootstrap=True, oob_score=False, n_jobs=None, random_state=None, verbose=0, warm_start=False, c