异构分布式系统中任务聚类对处理器利用率的影响
在网络处理器环境下,如集群、网格和效用计算,为了最大化系统吞吐量,人们一直在研究和开发实际的任务执行模型。其中一个主要趋势是将所需数据分割成若干部分,然后像“主 - 从模型”那样分发给工作节点。然而,对于计算密集型作业如何分割成多个执行单元进行并行执行,从理论角度仍在探讨中。
1. 背景与目标
在网格环境中考虑任务并行化时,需要建立有效的任务调度策略。同时,在结合任务调度概念和网格计算方法时,应将处理能力、通信带宽等方面的异构性纳入任务调度策略。常见的目标函数包括:
- 最小化每个作业的调度长度。
- 最小化最后一个作业的完成时间。
- 最大化每个计算资源对总加速比的贡献程度。
2. 相关工作
在分布式环境中,任务聚类是一种已知的任务调度方法。在任务聚类中,两个或多个任务合并成一个集群,使得它们之间的通信局部化,每个集群成为一个处理器的分配单元。然而,在异构分布式系统中进行任务聚类时,目标是找到最优的处理器分配,即确定哪个处理器应分配给由任务聚类生成的集群。以下是几种相关的任务聚类方法:
- CHP算法 :首先假设“虚拟相同处理器”,其处理速度是给定处理器集合中的最小值。然后执行任务聚类以生成一组集群。在处理器分配阶段,选择最早可以调度的集群和能使该集群完成时间最早的处理器。但该算法会导致多个处理器被分配到集群,无法实现处理器利用率的优化。
- Triplet算法 :将任务分组为“三元组”,根据任务之间的数据传输大小和每个任务的出度进行命名。然后根据最快和最慢处理器上的执行时间和数据传输
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



