计算机集群与大规模并行计算架构解析
1. 集群开发与使用需考虑的问题
在开发和使用集群时,有几个关键问题需要考虑,尽管在这方面已经做了很多工作,但它仍然是一个活跃的研发领域。
1.1 可扩展性能
可扩展性能指的是资源(如集群节点、内存容量、I/O带宽等)的扩展会带来性能的成比例提升。根据应用需求或成本效益的考虑,既需要向上扩展(scale - up)能力,也需要向下扩展(scale - down)能力。可扩展性是集群计算的驱动力,在集群或大规模并行处理(MPP)计算系统的所有应用中都不应忽视这一因素。
1.2 单系统映像(SSI)
通过以太网连接的一组工作站不一定构成一个集群,集群应是一个单系统。例如,一个工作站有300Mflops/秒的处理器、512MB内存和4GB磁盘,能支持50个活跃用户和1000个进程。将100个这样的工作站集群化,能否得到一个相当于拥有30Gflops/秒处理器、50GB内存、400GB磁盘,能支持5000个活跃用户和100000个进程的巨型工作站呢?这是一个有吸引力但很难实现的目标,SSI技术旨在实现这一目标。
1.3 可用性支持
集群可以通过处理器、内存、磁盘、I/O设备、网络和操作系统映像的大量冗余提供具有成本效益的高可用性(HA)能力。然而,要实现这种潜力,需要可用性技术。
1.4 集群作业管理
集群试图从通常利用率不高的传统工作站或PC节点实现高系统利用率。这需要作业管理软件来提供批处理、负载均衡、并行处理等功能,还需要特殊的软件工具来同时管理多个作业。
超级会员免费看
订阅专栏 解锁全文
1192

被折叠的 条评论
为什么被折叠?



