1、随机森林(random forest)简介
随机森林是一种集成算法(Ensemble Learning),它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能。其可以取得不错成绩,主要归功于“随机”和“森林”,一个使它具有抗过拟合能力,一个使它更加精准。
集成算法的目的:让机器学习的效果更好,单个不行,群殴走起
集成方法:
- Bagging:训练多个分类器取平均 f ( x ) = 1 M ∑ m = 1 M f m ( x ) f(x)=\frac{1}{M}\displaystyle\sum_{m=1}^Mf_m(x)