今天继续读了昨天PaToH的手册,已经读到函数所需参数了。
紧接着读了一篇和我们的模型相关的论文《A data placement strategy in scientific cloud workflows》,主要讲的是多数据中心间数据放置策略。这篇文章也没有读完,读了一半了。现在的理解就是它的主要内容是云计算文件调度的问题。
它的主要目的是减少数据中心间文件的传递,尽可能将任务分配到含有所需输入文件的数据中心上进行,以减少文件的传递。
它使用K-means聚类策略(k-means clustering strategy),分别在数据构建及运行阶段来对数据文件进行调度。
具体的内容明天继续分析。