【监督学习】第八课树型学习方法与集成方法（Adaboost，回归树，分类树，bagging）

机器玄学实践者

于 2018-07-15 17:52:29 发布

阅读量1.3k

点赞数

CC 4.0 BY-SA版权

分类专栏：监督学习文章标签： adaboost 分类树回归树监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_39673686/article/details/81052688

这篇博客探讨了树型学习算法，包括Adaboost、回归树和分类树，并详细介绍了bagging和boosting。文章阐述了如何通过树方法划分空间以减少过拟合风险，同时分析了剪枝策略。此外，还讨论了群体学习的Chernoff边界和bagging方法，以及boosting中的加权误差率和训练误差分析。

这节课讲的是各种树相关的学习算法或模型，以及它们是如何集成的。

树方法试图将空间分割成长方形集合，然后在这些长方形上拟合一个模型。

其中Rn表示一个区域，region。也就是一个长方形。这些长方形彼此没有交集，共同构成整个空间。

I函数则表示对或错。如果x属于Rn，那么I的值为1，否则为0.

而cn代表自然选择。也就是在Rn区域中所有y的平均值。

利用单阈值，我们可以对某个属性值进行切割，将一个平面分成两个。如果不停的切分，整个空间都可以无限分割下去。

如图，有三个属性，只对其中的两个属性做切分，最后可以将整个空间分成5个区域，而R4就是红色被标记的区域。

可以看出，树方法有良好的解释性，但有过拟合的风险。

理论上说，我们需要找到N个区域让平方误差最小。但是实际上这个过程会耗费大量计算资源。于是我们用另一个启发性算法。

首先定义一个区域函数，R1表示第j个属性值小于s的数据点x，R2表示大于。

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。