APST:网格环境下的参数扫描工具解析
1. APST概述
APST具有多个显著特性,使其在网格计算领域具有独特优势:
- 资源信息利用 :若有可用的资源性能信息服务,APST的调度器可借助这些信息做出更优调度决策;若没有,APST仍能运行,只是性能可能降低。用户能先在本地资源上使用默认服务(如ssh启动远程作业)部署应用,后续可按需逐步获取需其他服务的新资源。
- 轻量级软件 :采用标准打包技术,且仅需安装在单个主机(通常是用户本地机器)上,通过复用已部署的中间件服务访问资源,降低了软件的复杂性,便于用户接受。
- 用户流程自动化 :不改变用户运行应用的方式,而是将该过程自动化。只要应用的输入输出通过文件和命令行参数完成(多数参数扫描应用皆如此),一般无需修改应用代码。
- 简单用户界面 :选用基于XML的简单界面,可从命令行或脚本使用,且能轻松与Grid portals、ILAB、Nimrod/G等更复杂的界面集成。
- 弹性机制 :考虑到网格资源共享且易出现故障和停机,APST实现了简单的故障检测重启机制,并利用中间件服务的相关机制。对于长时间运行的参数扫描应用,还实现了检查点机制,以便在APST崩溃时能以最小损失恢复应用。
2. 软件架构
APST软件设计为两个不同的进程:守护进程(daemon)和客户端(client)。
- 守护进程 :负责应用的部署和监控,其核心组件是调度器,调度
超级会员免费看
订阅专栏 解锁全文
1181

被折叠的 条评论
为什么被折叠?



