集成算法ensemble learning
一:bagging bootstrap aggregation
训练多个分类器求平均值
随机:每一树按照一定比例随机采样(有放回的采样),特征选择随机
优势:选择随机,保证很强的泛化能力
代表:如随机森林
森林:很多决策树并行求平均值
计算公式:
二:boosting从弱学习器加强
代表:AdaBoost 根据前一次的分类效果调整数据权重
计算公式:
三:stacking堆叠模型
聚合多个分类或回归模型
训练多个分类器求平均值
随机:每一树按照一定比例随机采样(有放回的采样),特征选择随机
优势:选择随机,保证很强的泛化能力
代表:如随机森林
森林:很多决策树并行求平均值
计算公式:
代表:AdaBoost 根据前一次的分类效果调整数据权重
计算公式:
聚合多个分类或回归模型