回顾
- 决策树的分类能力由叶子节点上的条件概率分布决定
- 决策树的内路径只决定了特征空间的划分情况,即给定一个样本xi,最终会落在哪个节点
思考:
提升的定义
提升的框架
思路:在构建好的k-1棵决策树的基础上,构建第k棵决策树
符号说明:
这里需要解释一下俩棵决策树的加权和的含义
权值a1,a2取值不同,首先决定了不同的特征空间的划分,统计后得到不同的条件概率,是一棵抽象的树结构
- 首先,给定常函数F0(x):
并且由之前关于cost function中的讨论,F0(X)总是可求的 - 以贪心的思路扩展得到Fm(x):
目标函数的计算
这里的所谓权值w就是P(Y|X)的条件分布