Condor与网格计算技术详解
1. 网格计算中的Condor基础
在网格计算的发展进程中,Condor系统扮演着重要角色。其核心组件构成的内核,是整个系统运行的基础。用户将作业提交给代理,代理负责在持久存储中记录作业信息,并寻找愿意运行这些作业的资源。代理和资源会向匹配器进行自我宣传,匹配器则负责介绍可能兼容的代理和资源。当双方建立联系后,代理要联系资源并验证匹配是否仍然有效。在作业执行时,代理端的影子负责提供执行作业所需的所有细节,资源端的沙箱则负责为作业创建安全的执行环境,并保护资源不受任何恶意行为的影响。
以下是Condor内核主要进程的表格说明:
| 通用名称 | Condor特定名称 | 功能 |
| ---- | ---- | ---- |
| 问题解决器 | DAGMan、Master - Worker | 处理作业流程 |
| 用户 | - | 提交作业 |
| 匹配器 | 中央管理器 | 介绍代理和资源 |
| 代理 | 调度器 | 管理作业提交和资源寻找 |
| 影子 | 影子 | 提供作业执行细节 |
| 资源 | 启动守护进程 | 提供作业运行环境 |
| 沙箱 | 启动器 | 创建安全执行环境 |
早期的Condor池构建方式是,代理和资源独立地向一个知名的匹配器报告自身信息,匹配器再将这些信息提供给社区。一台机器通常可以同时运行代理和资源守护进程,具备提交和执行作业的能力。而且,代理和资源在逻辑上是不同的,一台机器可以根据所有者的需求运行其中一个或两个,甚至可以运行多个代理实例。
超级会员免费看
订阅专栏 解锁全文
62

被折叠的 条评论
为什么被折叠?



