randomforestregressor参数详解

Ling_Ze

已于 2022-09-14 11:33:36 修改

阅读量6.9k

点赞数 5

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：决策树机器学习人工智能

于 2022-07-29 10:45:03 首次发布

本文链接：https://blog.youkuaiyun.com/Ling_Ze/article/details/126050941

机器学习专栏收录该内容

4 篇文章

订阅专栏

本文详细解读sklearn的RandomForestRegressor参数，包括n_estimators、criterion、max_depth等，帮助理解如何调整这些参数以提高回归预测的准确性和防止过拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

randomforestregressor参数详解：

sklearn.ensemble.RandomForestRegressor(  n_estimators=10,   #  数值型参数，默认值为100，此参数指定了弱分类器的个数。设置的值越大，精确度越好，但是当 n_estimators 大于特定值之后，带来的提升效果非常有限。
										 criterion='mse',   # 其中，参数criterion 是字符串类型，默认值为 ‘mse’，是衡量回归效果的指标。可选的还有‘mae’ 。
										 max_depth=None,    # 数值型，默认值None。这是与剪枝相关的参数，设置为None时，树的节点会一直分裂，直到：（1）每个叶子都是“纯”的；（2）或者叶子中包含于min_sanples_split个样本。推荐从 max_depth = 3 尝试增加，观察是否应该继续加大深度。
										 min_samples_split=2,  # 数值型，默认值2，指定每个内部节点(非叶子节点)包含的最少的样本数。与min_samples_leaf这个参数类似，可以是整数也可以是浮点数。
										 min_samples_leaf=1,  # 数值型，默认值1，指定每个叶子结点包含的最少的样本数。参数的取值除了整数之外，还可以是浮点数，此时（min_samples_leaf * n_samples）向下取整后的整数是每个节点的最小样本数。此参数设置的过小会导致过拟合，反之就会欠拟合。
										 min_weight_fraction_leaf=0.0,  # (default=0) 叶子节点所需要的最小权值
										 max_features='auto',   # 可以为整数、浮点、字符或者None，默认值为None。此参数用于限制分枝时考虑的特征个数，超过限制个数的特征都会被舍弃。
										 max_leaf_nodes=None,   # 数值型参数，默认值为None，即不限制最大叶子节点数。这个参数通过限制树的最大叶子数量来防止过拟合，如果设置了一个正整数，则会在建立的最大叶节点内的树中选择最优的决策树。
										 min_impurity_split=1e-07, # float, optional (default=0.)如果节点的分裂导致不纯度的减少(分裂后样本比分裂前更加纯净)大于或等于min_impurity_decrease，则分裂该节点。
										 bootstrap=True,        # 是否有放回的采样。
										 oob_score=False,       #  oob（out of band，带外）数据，即：在某次决策树训练中没有被bootstrap选中的数据
										 n_jobs=1,              # 并行job个数。
										 random_state=None,      # # 随机种子
										 verbose=0,          # (default=0) 是否显示任务进程
										 warm_start=False)   # 热启动，决定是否使用上次调用该类的结果然后增加新的。