集群计算概述
1. 集群类型
集群计算系统在管理系统资源和协调并行执行方面表现出色,能为许多应用提供卓越的性价比。常见的集群类型有:
- 集群农场 :由现有的局域网内的个人计算机(PC)和工作站组成,这些设备既可以作为专用用户站,也可以作为服务器。当它们处于空闲状态时,可用于处理外部用户的待处理工作。例如,像Condor这样的软件系统,利用作业流并行性,在不侵犯用户资源的前提下,将排队的工作进行分配。不过,由于这类系统使用共享网络来整合资源,相较于工作站集群和Beowulf集群使用的专用网络,其性能和效率较低。
- 超级集群 :由多个集群组成,通常位于同一局域网内,如共享机房或同一工业或学术园区的不同建筑中,一般通过机构的基础设施骨干广域网进行集成。虽然这些集群通常处于同一互联网域内,但可能分属不同的所有者和管理责任主体。目前,各组织正在努力探索如何利用多个本地集群的合作潜力,以实现大规模计算。
2. 硬件系统结构
集群计算系统最显著且常被讨论的方面是其物理组件和组织方式。这些组件赋予了系统原始的计算能力,占用机房大量空间,同时也带来了出色的性价比。Beowulf集群主要由计算节点和互连网络两个子系统组成。
2.1 Beowulf计算节点
计算节点包含了执行程序所需的所有硬件设备和机制,主要由以下五个关键组件构成:
- 微处理器 :为节点提供计算能力,其性能通常以每秒百万条指令(Mips)和每秒百万次浮点运算(Mflops)来衡量。目前,32位的英特尔奔腾3和奔腾4微处理器以及64位的康柏A