一种科学工作流的云数据布局与任务调度策略.pdf
第32卷第3期 计算机仿真 2015年3月
文章编号:1006—9348(2015)03—0421—05
一种科学工作流的云数据布局与任务调度策略
王润平,陈旺虎,段菊
(西北师范大学计算机科学与工程学院,甘肃兰州730070)
摘要:云计算环境下,数据密集型科学工作流的数据文件在多数据中心间的合理布局,对科学工作流的执行效率具有很大的
影响。根据科学工作流各数据集之间的依赖关系,并聚焦于运行科学工作流的各数据中心的处理能力差异和网络性能差
异,提出一种可提高科学_I=作流执行性能的数据布局以及数据布局敏感的任务调度策略。分析和实验表明,上述策略可有
效减少科学工作流运行时跨数据中心的数据传输,降低科学工作流的运行时间,从而提高科学工作流整体运行效率。
关键词:云计算;科学工作流;数据依赖;数据布局;任务调度
中图分类号:TP301.6文献标识码:B
A DataPlacementandTask forScientific
Cloud SchedulingStrategy
WANG Ju
Run—ping,CHENWang—hu,DUAN
of and Normal Gansu
Science,Northwest 730070,China)
(CoHegeComputerEngineering University,Lanzhou
cloud adata—intensivescientific rationaldistributionofits
ABSTRACT:In environment,for WOrkflow,the
computing
taskdatafilesin clouddatacenterswill itsexecution this onthe
multiple largelyimpact efficiency.Inpaper,based
data and related forscien—
ofscientificworkflowtask the
data,a strategy schedulingapproach
dependence placement
in the
titleworknowscloudwas can workfiowexecution
proposed,whichimprove efficiency.Theprocessingcapacity
differencesofdatacentersandthebandwidthdifferencesthemwerealsotakenintoaccount.Theand
among analysis
andthetimeco