在约束规划中嵌入决策树和随机森林
1. 引言
在约束规划(CP)模型中嵌入机器学习中的决策树(Decision Trees)和随机森林(Random Forests)这两种基于树的分类器是本文探讨的问题。分类器是一个将离散或数值属性的元组映射到离散类别的函数。通过引入变量向量 x 表示属性,变量 y 表示类别,我们需要找到一组约束条件,保证并强化关系 x = v ∧ y = w ⇔ f(v) = w 的一致性。有效的嵌入技术不仅能像函数求值器一样工作,还能根据 x 的当前域缩小 y 的可能值集合,反之亦然,即能够进行域过滤。
本文介绍了三种用于决策树和随机森林的 CP 编码技术:
1. 基于规则并通过元约束建模的方法;
2. 基于数值属性离散化和全局表约束的编码;
3. 另一种依赖属性离散化,但使用 mdd 约束而非表约束的方法。
这三种方法各有优劣:基于规则的编码可扩展性最佳,但传播能力最弱;表和 mdd 方法都能强制全局弧一致性(GAC),但在处理大型复杂树时可能会遇到可扩展性问题。
我们在英特尔的单芯片云计算计算机(SCC)的热感知工作负载调度问题上对这些方法进行了实验,目标是最大化高效运行的核心数量。由于每个核心的效率取决于许多复杂因素,传统的专家设计模型难以评估作业映射的效果,因此我们通过学习一组决策树(或随机森林)来近似模型,每个模型用于预测特定核心在特定工作负载下的效率高低(类别 1 表示高效,类别 0 表示低
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



