具体的在Jupyter 里
课程学习:2 1. 集成算法概述_trim_哔哩哔哩_bilibili
课程4-随机森林
1、集成算法
随机森林是一种集成算法。集成学习ensemble learning 不是一个单独的ML算法,而是通过在数据集上构成多个模型,集成所有模型的建模结果。随机森林、梯度提升数GBDT、Xgboost等集成算法应用较广。
目标:集成算法会考虑多个评估器的建模结果,汇总之后得到一个综合的结果,以此来获取比单个模型更好的回归或分类表现。
三类集成算法:袋装法bagging、提升法boosting和stacking
Singel单个模型;
bagging里面模型独立:装袋法的核心思想是构建多个相互独立的评估器,然后对其预测进行平均或多数表决原则来决定集成评估器的果。装袋法的代表模型就是随机森林。