集成学习(ensemble learning)
定义:通过构建并结合多个学习器来完成学习任务。
要获得好的集成,个体学习器应该“好而不同”
即个体学习器要有一定的准确性,并且要有多样性,即学习器间具有差异。
集成学习的分类:Boosting,Bagging
Boosting : 个体学习器存在强的依赖关系,必须串行生成的序列化方法 ,代表算法 AdaBoost ;
Bagging : 个体学习器不存在强依赖关系,可同时生成的并行化方法,代表算法 Random Forest 。。
参考文献
【1】周志华《机器学习》