机器学习技法之Aggregation方法总结:Blending、Learning(Bagging、AdaBoost、Decision Tree)及其aggregation of aggregation

本文总结了台大林轩田教授的机器学习技法课程中的融合方法,包括静态的Blending(uniform和non-uniform融合)和动态的Learning(如Bagging, AdaBoost, Decision Tree)。Aggregation模型如Random Forest和Gradient Boosted Decision Tree用于克服欠拟合和过拟合,增强模型能力并实现正则化效果。" 100934783,5766778,Lucene使用IK分词器与自定义词库教程,"['搜索引擎', '文本处理', '信息检索', 'nlp', '分词']

本文主要基于台大林轩田老师的机器学习技法课程中关于使用融合(aggregation)方法获得更好性能的g的一个总结。包括从静态的融合方法blending(已经有了一堆的g,通过uniform:voting/average、non-uniform:linear/non-linear和condition的融合形式来获取更好地性能),动态融合方法learning(没有一堆的g set,而是通过online learning获取g,边学习g,变边进行融合,对比于blending中的uniform融合形式的有bagging,具有uniform融合形式的有AdaBoost(Re-weighting),具有condition融合形式的有Decision Tree),之后还包括一些aggregation model的aggregation,比如Random Forest、Gradient Boosted Decision Tree等。利用aggregation model进行机器学习有以下两方面的考量:1)cure of underfitting:比如AdaBoost-Stump,对于单个Decision Stump进行分类或拟合时,很显然是能力不够的underfitting,我们需要提升G的能力,而通过aggregation就可以使得G变得strong和powerful;2)cure of overfitting:比如classification来说,我们通过aggregation得到了类似support vector的large margin的效果,即我们选择的是“moderate”的那个线(最明显的例子就是对于PLA,我得到了一堆的二维平面上可以分开的g

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Zhang_P_Y

感谢支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值