并行分布计算中的异构性

    HCW 2012并行和分布式计算的异构性的特刊论文来自于与IPDPS联合举办的国际HCW会议,该次会议吸引了41篇高品质的提案,其中17份在研讨会中陈诉和出版。所有提交的提案不仅扩展了HCW 2012论文,而且扩展了许多原始手稿版本,这些都是由该领域的顶级专家严格审查。审稿人和提交他们工作的所有作者的集体努力的成果反应在该特刊上,其中包括15份被接受的论文。它们涉及多种主题,从多核处理器架构到调度算法。以下各段给出了每一篇论文的概要。

    前两篇论文讨论了两个最新的片上多处理器架构。在论文“设计片上互连环CPU–GPU异构体系结构的空间探索”一文中,jaekyu Lee等人研究了集成在同一芯片上的CPU和GPU核心的异构芯片多处理器体系结构。在这种体系结构中,片上互连网络用于控制对CPU和GPU内核共享的资源访问。研究的重点是当CPU和GPGPU的应用程序同时运行时这种互连网络对该体系结构整体性能的影响,并提出了一种最优环形互连网络。
    论文“基于单芯片云端计算机上多核处理器的稀疏矩阵向量乘法”中,Juan C. Pichel和Francisco F. Rivera研究实验单芯片云端计算机(SCC)上48核英特尔处理器在执行稀疏矩阵向量乘法,这样一个不规则应用程序的性能潜力和功率效率。
    论文“基于位置感知线程的关于分层异构多核的高能效多线程”,由Patrick Anthony La Fratta和Peter M Kogge,提出一个新型异构多核处理器架构,无源/有源多核,这也在作者以前的出版物提到过。在本文中,作者提出了这种架构的节能多线程技术。
    由多核CPU和GPU加速器组成的计算节点以及由这样的计算节点构建的高性能计算(HPC)系统已经越来越普遍。接下来的三篇论文研究了在这些平台上的三种不同类型应用程序的高效执行优化。在论文“结合多核GPU计算求解组合优化问题”中,Imen Chakroun等人提出并研究了在多核CPU和GPU相结合的节点上实现分支定界算法的优化技术。
    论文“执行在大型多核加速器平台的高效异构:使用区块对角求解程序案例研究”,作者Alfred J. Park和Kalyan S. Perumalla展示了应用于区块对角求解的若干优化的案例,该优化让作者实现了由大量多核CPU + GPU节点组成的高端平台与仅一个多核的实现相比的10倍加速比。
    论文“千万亿次运算级别异构系统中为分子动力学开发分层并行算法”中QiangWu等人提出了一种由多核CPU + GPU计算节点组成的高端系统的分子动力学模拟并行化方案,以及一个类似系统的方案评估,如一个千万亿次运算级别超级计算机TH-1A。
    论文“基于质子计算机断层扫描(pCT)的临床医学影像的分布式硬件加速计算”,Caesar Estrada Ordonez等人提出了一种pCT图像重建的并行实现方法,一个计算集群由60个计算节点,每个节点由一个多核CPU和两个GPU组成。
    GPU加速平台上的应用程序的高效实现需要高度优化的GPU或多GPU计算内核。这种内核的发展是一个具有挑战性的科学和工程问题。有时在传统的HPC平台上被认为是边缘和低效的算法和方法,在基于GPU的平台表现更优。文中“关于图形处理单元的区块异步松弛法”,是Hartwig Anzt等人研究线性代数内核的实施,即基于GPU和多GPU的线性系统的解的迭代方法。结果表明,尽管收敛速度较低,但异步松弛法的整体性能优于同步松弛法。
    接下来的三篇论文讨论了异构并行平台的可编程性问题。Moises Viñas等人在他们的论文“用异构编程库开发异构并行程序”中为可编程异构计算节点提出并评估了异构编程库,这是OpenCL之外的另一种选择,。
    论文“dOpenCL:面向分布式异构多/众核系统的统一编程”中Philipp Kegel等人提出了dOpenCL,这是关于异构节点集群的扩展OpenCL。
    HMPP(混合的多核并行编程)是一种基于指令的编程模型,该模型为单一的GPU加速计算节点的简化编程而设计。论文“关于分布式GPU并行程序的生成数据转换”中Frédérique Silber-Chaussumier等人描述了一种编程工具,该编程工具将HMPP程序自动转换为GPU加速计算节点集群上执行的HMPP + MPI程序。
    该刊物的四篇论文讨论了异构环境下的调度和资源分配问题。论文”TLA:异构多机群系统的临时前向处理器分配方法”中Po-Chi Shih等人提出了一种新的动态分配任务的方法,该方法使用分配模拟过程对异构多集群的处理器进行分配。
    论文”基于Monte Carlo法的随机DAG调度”中Wei Zheng 和 Rizos Sakellariou提出了基于蒙特卡洛法的新方法,用于调度单任务执行时间不确定性的DAG任务。论文“在极小化云程序资源消耗上利用过程迁移”中Nikos Tziritas等人提出了一种全分布式算法,该算法动态选择进程与虚拟机之间分配方案,云系统的计算节点以最小化资源消耗为目标。
    论文“在异构多核系统中DAG图的静态资源分配的鲁棒性”中Luis Diego Briceno Guerrero等人展示了一种涉及在异构集群多核计算节点下处理大量的具有期限约束的卫星数据的应用。作者提出并分析了五种分配启发式算法,其目的是采用统一的方法为集群分配任务,这些任务有着共同的完成期限,并且它们的完成时间对执行时间的不确定性具有鲁棒性。

Editorial
Heterogeneity in parallel and distributed computing

J. Parallel Distrib. Comput.

Alexey Lastovetsky
School of Computer Science and Informatics,
University College Dublin, Belfield,
Dublin 4, Ireland

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值