【监督学习】第八课 树型学习方法与集成方法(Adaboost,回归树,分类树,bagging)

这篇博客探讨了树型学习算法,包括Adaboost、回归树和分类树,并详细介绍了bagging和boosting。文章阐述了如何通过树方法划分空间以减少过拟合风险,同时分析了剪枝策略。此外,还讨论了群体学习的Chernoff边界和bagging方法,以及boosting中的加权误差率和训练误差分析。

这节课讲的是各种树相关的学习算法或模型,以及它们是如何集成的。


树方法试图将空间分割成长方形集合,然后在这些长方形上拟合一个模型。


其中Rn表示一个 区域,region。也就是一个长方形。这些长方形彼此没有交集,共同构成整个空间。

I函数则表示对或错。如果x属于Rn,那么I的值为1,否则为0.

而cn代表自然选择。也就是在Rn区域中所有y的平均值。


利用单阈值,我们可以对某个属性值进行切割,将一个平面分成两个。如果不停的切分,整个空间都可以无限分割下去。


如图,有三个属性,只对其中的两个属性做切分,最后可以将整个空间分成5个区域,而R4就是红色被标记的区域。

可以看出,树方法有良好的解释性,但有过拟合的风险。



理论上说,我们需要找到N个区域让平方误差最小。但是实际上这个过程会耗费大量计算资源。于是我们用另一个启发性算法。


首先定义一个区域函数,R1表示第j个属性值小于s的 数据点x,R2表示大于。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值