构建生产级网格:经验与实践
1. 大规模网格建设背景与目标
近年来,众多项目致力于构建“生产级”网格,旨在为特定用户群体提供丰富、稳定且标准的分布式计算环境。这里的“标准”网格是基于全球网格论坛(GGF)的通用实践和标准。全球有多个项目处于构建生产级网格的不同阶段,如英国电子科学计划、欧洲数据网格、美国国家航空航天局(NASA)的信息动力网格(IPG)、美国能源部(DOE)科学网格等,还有处于早期发展阶段的亚太网格。
除了基础网格基础设施项目,还有许多先进项目旨在提供供科学界直接使用的高级网格服务,如Ninf和GridLab。本文重点介绍构建NASA的IPG和DOE的科学网格所积累的经验,这两个项目均针对大规模协作科学以及对大规模计算和存储设施的访问。
2. 网格软件选择
构建这两个网格主要使用了以下软件套件:Globus、Condor、SRB/MCAT、PBSPro和PKI认证基础架构。选择Globus的原因如下:
- 具有清晰、强大且基于标准的安全模型。
- 模块化功能,提供除通用事件外的所有网格通用服务。
- 有明确的模型来维护纳入Globus网格的资源的本地控制。
- 采用允许软件分散控制和部署的通用设计方法。
- 具备实现大规模元计算的能力。
- 在超级计算环境中广泛存在。
- 明确承诺开源。
- 拥有较高的市场份额。
最初也考虑过Legion和UNICORE,但它们未能满足上述部分选择标准。SRB和Condor被添加是因为它们为IPG网格提供了特定的必要功能,并且有机会与Globus集成。PBS被选中是因为它在NAS环境中与IPG一起积极开发,并
超级会员免费看
订阅专栏 解锁全文
171万+

被折叠的 条评论
为什么被折叠?



