3D 工业配置软件与两阶段决策树算法解析
两阶段决策树算法
在构建决策树时,两阶段决策树算法(TSDT)为构建超平面提供了一种有效的方法。
基础理论
设 $t=( t_1, t_2, …, t_n)$ 是 $A$ 和 $P$ 的交点,由于 $W_T$ 是 $P$ 的法向量,则 $t = a’$。结合相关公式可得:
$\sum_{i = 1}^{n} v_{i}t_{i} \leq \sum_{i = 1}^{n} w_{i}a_{i} \leq b$
由某个方程可知 $v =$ 阈值。若 $W_T$ 中只有一个参数不为 0,例如 $W_T = (0, 0, …, w_i, …, 0)$,那么命题 1 中的法向恰好是实例空间的一个特征。因此,单变量决策树满足命题 1,从这个角度看,该算法框架是单变量决策树的扩展。而且,一旦找到法向,就可以简单地求解超平面的阈值:将每个实例的法向分量计算为一维空间值,然后根据某种准则(如基尼系数)搜索最佳分割值作为函数的阈值。
TSDT 算法流程
搜索超平面函数的过程可分为两个阶段,基于此引入了 TSDT 算法。该算法构建决策树的流程如下:
1. 第一阶段 :使用一些学习函数构建候选超平面的法向列表。可以直接应用许多知名方法来搜索法向,如主成分分析(PCA)、独立成分分析(ICA)等。
2. 第二阶段 :
- 第一子阶段 :根据某种纯准则(如信息增益比和基尼系数)检测每个候选超平面的阈值,这与单变量决策树算法检测连续属性分割点类似。
超级会员免费看
订阅专栏 解锁全文
1151

被折叠的 条评论
为什么被折叠?



