机器学习技法之Aggregation方法总结：Blending、Learning（Bagging、AdaBoost、Decision Tree）及其aggregation of aggregation

最新推荐文章于 2020-12-23 21:50:14 发布

Zhang_P_Y

最新推荐文章于 2020-12-23 21:50:14 发布

阅读量3.3k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习机器学习杂烩

本文链接：https://blog.youkuaiyun.com/LG1259156776/article/details/46863197

机器学习杂烩同时被 2 个专栏收录

59 篇文章 ¥39.90 ¥99.00

订阅专栏

机器学习

90 篇文章

订阅专栏

本文总结了台大林轩田教授的机器学习技法课程中的融合方法，包括静态的Blending（uniform和non-uniform融合）和动态的Learning（如Bagging, AdaBoost, Decision Tree）。Aggregation模型如Random Forest和Gradient Boosted Decision Tree用于克服欠拟合和过拟合，增强模型能力并实现正则化效果。" 100934783,5766778,Lucene使用IK分词器与自定义词库教程,"['搜索引擎', '文本处理', '信息检索', 'nlp', '分词']

本文主要基于台大林轩田老师的机器学习技法课程中关于使用融合（aggregation）方法获得更好性能的g的一个总结。包括从静态的融合方法blending（已经有了一堆的g，通过uniform：voting/average、non-uniform：linear/non-linear和condition的融合形式来获取更好地性能），动态融合方法learning（没有一堆的g set，而是通过online learning获取g，边学习g，变边进行融合，对比于blending中的uniform融合形式的有bagging，具有uniform融合形式的有AdaBoost（Re-weighting），具有condition融合形式的有Decision Tree），之后还包括一些aggregation model的aggregation，比如Random Forest、Gradient Boosted Decision Tree等。利用aggregation model进行机器学习有以下两方面的考量：1）cure of underfitting：比如AdaBoost-Stump，对于单个Decision Stump进行分类或拟合时，很显然是能力不够的underfitting，我们需要提升G的能力，而通过aggregation就可以使得G变得strong和powerful；2）cure of overfitting：比如classification来说，我们通过aggregation得到了类似support vector的large margin的效果，即我们选择的是“moderate”的那个线（最明显的例子就是对于PLA，我得到了一堆的二维平面上可以分开的g

了解本专栏