计算机集群与大规模并行计算技术剖析
1 集群开发与使用需考虑的问题
在开发和使用集群时,有几个关键问题需要考虑,尽管在这方面已经做了很多工作,但它仍然是一个活跃的研发领域。以下是这些问题的详细介绍:
1. 可扩展性能 :资源(如集群节点、内存容量、I/O 带宽等)的扩展应能带来性能的成比例提升。根据应用需求或成本效益的考量,既需要向上扩展的能力,也需要向下扩展的能力。可扩展性是集群计算的驱动力,在所有集群或大规模并行处理(MPP)计算系统的应用中都不应忽视这一因素。
2. 单一系统映像(SSI) :通过以太网连接的一组工作站不一定能构成一个集群,集群应是一个单一系统。例如,将 100 个具有特定性能的工作站进行集群,期望得到一个相当于巨型工作站的单一系统,但这一目标很难实现。SSI 技术旨在达成这一目标。
3. 可用性支持 :集群能够利用处理器、内存、磁盘、I/O 设备、网络和操作系统映像的冗余性,提供具有成本效益的高可用性(HA)能力。然而,要实现这一潜力,需要相应的可用性技术。
4. 集群作业管理 :集群试图提高传统工作站或 PC 节点的系统利用率,这些节点通常利用率不高。因此需要作业管理软件来提供批处理、负载均衡、并行处理等功能,同时需要特殊的软件工具来同时管理多个作业。
5. 节点间通信 :由于集群节点的复杂度较高,无法像 MPP 节点那样紧凑封装,节点间的物理线路更长,这会导致互连网络延迟增加,并且在可靠性、时钟偏移和串扰方面存在更多问题。因此需要可靠和安全的通信协议,但这
超级会员免费看
订阅专栏 解锁全文
3573

被折叠的 条评论
为什么被折叠?



