吃瓜有感-机器学习西瓜书摘要7

文章介绍了集成学习的基本概念,包括同质和异质集成,强调个体学习器应具备“好而不同”的特点。接着,重点讲述了Boosting算法,如AdaBoost,其目标是降低偏差。然后,提到了并行式集成方法Bagging,主要用于降低方差,并介绍了随机森林作为Bagging的扩展,通过引入随机属性选择提升性能。

学习周志华老师《机器学习》西瓜书第8章 集成学习 摘要及笔记。

个体与集成

        集成学习:构建并结合多个学习器来学习任务。

        同质的集成:只包含同种类型的个体学习器("基学习器"),相应算法称为“基学习算法”。

        异质的集成:包含不同类型的个体学习器,由不同算法生成。

        个体学习器应“好而不同”。

Boosting

        Boosting是一族可将弱学习器提升为强学习器的算法,个体学习器间存在强依赖关系,必须串行生成。典型代表是AdaBoost。比较容易理解的是基于“加性模型”,即基学习器的线性组合

来最小化指数损失函数

Boosting主要关注降低偏差。

Bagging与随机森林

        Bagging是并行式集成学习方法的代表,基于自助采样法。若基学习器的计算复杂度为O(m),则Bagging的复杂度大致为T(O(m)+O(s)).Bagging可以用于多分类,回归等任务。

        Bagging主要关注降低方差。

        随机森林是Bagging的一个扩展变体,在以决策树为基学习器构建Bagging集成的基础上,在训练过程中引入了随机属性选择。随机森林简单,易实现,计算开销小,性能强大,训练效率优于Bagging。

 

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值