这里是基于前面两篇相关文章
基于随机森林做回归任务(数据预处理、MAPE指标评估、可视化展示、特征重要性、预测和实际值差异显示图)
https://blog.youkuaiyun.com/qq_40229367/article/details/88526749
数据与特征对随机森林的影响(特征对比、特征降维、考虑性价比)
https://blog.youkuaiyun.com/qq_40229367/article/details/88528421
本文讨论的是随机森林参数的 选择对结果的影响
这里的处理是基于前面选择了前两个比较重要的特征后的数据
我们首先看一下随机森林有哪些参数
from sklearn.ensemble import RandomForestRegressor
rf = RandomForestRegressor(random_state = 42)
from pprint import pprint
# Look at parameters used by our current forest
print('Parameters currently in use:\n')
pprint(rf.get_params())
Parameters currently in use: {'bootstrap': True, 'criterion': 'mse', 'max_depth': None, 'max_features': 'auto', 'max_leaf_nodes': None, 'min_impurity_decrease': 0.0, 'min_impurity_split': None, 'min_sampl