本章也是预测数值型数据,非分类算法。
前面介绍了线性回归预测数值型数据,但是有不足:
(1)需要拟合所有的样本点(局部加权线性回归除外)
(2)当数据拥有众多特征且特征之间关系十分复杂时,构建全局模型的想法就显得很难了,也略显笨拙。
(3)实际生活中很多问题都是非线性的,不可能使用全局线性模型来拟合任何数据。
所以就用到了树回归,树结构和回归法结合。
树回归是通过构建树,来对连续性数值型(回归)数据进行预测。所以首先构建树,将构建两种树:回归树和模型树,然后分别用户回归。
(1)回归树(regression tree),其每个叶节点包含单个值。
(2)模型树(model tree),其每个叶节点包含一个线性方程。
一、CART算法构建(通用)树
CART(Classification And Regression Trees,分类

本文介绍了树回归算法,作为线性回归的补充,解决非线性问题。通过CART算法构建回归树和模型树,其中回归树的叶节点是常数值,模型树的叶节点是线性方程。过拟合问题通过剪枝来解决,包括预剪枝和后剪枝。后剪枝通过测试集来确定最佳模型,而模型树则以线性模型来拟合数据,误差计算方法不同于回归树。
最低0.47元/天 解锁文章
1314

被折叠的 条评论
为什么被折叠?



