1、bagging
步骤如下:
(1)从样本集合中有放回地选出n个样本
(2)在所有属性上,对这n个样本建立分类器(分类器可以是决策树,SVM,Logistic回归等)
(3)重复步骤(1)、(2)m次,得到m个分类器
(4)用m个分类器对数据的预测结果进行投票
2、随机森林
步骤如下:
(1)从样本集合中有放回地选出n个样本
(2)从所有属性中选出k个属性,对这n个样本建立分类器(分类器为CART决策树)
(3)重复步骤(1)、(2)m次,得到m个分类器
(4)用m个CART决策树形成的随机森林分类器对数据的预测结果进行投票