决策树和随机森林在约束规划中的嵌入研究
1. 核心数学表达式与约束
在研究中,我们的目标是对以下数学表达式执行一致性操作:
[y_F = \arg\max_{w\in C} (\text{cnty}(w))]
其中,(\text{cnty}(w) = | {y_j \in y : y_j = w} |)。为了对众数进行建模,我们采用了全局约束来计算计数函数和一个用于求最大值的约束。具体使用了以下一对约束:
- (gcc(y, C, z))
- (\text{element}(C, y_F, \max(z)))
这里,(C)是类(w)的集合,当作向量处理;(z)是一组新变量(z_w),每个变量通过(gcc)约束表示向量(y)中值(w)的基数。元素约束确保(y_F)是(C)中具有最大(z_w)值的(w)的索引,即众数。不过,这种方法在(z_w)变量出现平局时,众数计算可能不完整。在二元分类情况下,可通过使用奇数棵树解决该问题;一般情况下,用户可将(y_F)添加到分支变量中,强制求解器选择一个值。
2. 实验设置
研究进行了两部分实验。第一部分比较了所有用于嵌入决策树(DT)和随机森林(RF)的技术,以评估其有效性和可扩展性;第二部分将我们的约束规划(CP)方法与基于局部搜索的强大求解器进行了实际性能对比。
实验基于英特尔的48核CPU单芯片云计算机(SCC)模拟平台,该平台旨在接受作业批次,不支持进程迁移,且为研究目的增加了热控制器,核心效率取决于温度,而温度又受多种复杂因素影响。我们的目标是映射作业,使以“高”效率(≥97%)运行的核心数量最大化。
由于核心行为交互复杂,无法通过
超级会员免费看
订阅专栏 解锁全文
1606

被折叠的 条评论
为什么被折叠?



