集群计算与多处理器架构解析
1. 集群特性的相互依存性
在集群系统中,各项特性在很大程度上是相互依存的。以高可用性系统为例,其性能下降幅度超过预期损失范围,这与可扩展性密切相关。仅监控内部故障就需要大量开销,更不用说确定并重新分配资源和职责到集群中的其他系统了。此外,在协商纠正措施时,监控进程可能会出现故障,这可能导致递归恢复操作。而且,将集群资源用于管理集群的稳定性,而非直接服务用户,这之间存在着权衡。
2. 集群应用分类
2.1 超级计算机应用
超级计算机通过并行执行复杂的数值算法来求解方程。例如,它可以生成天气数据模式的图形投影,就像预测明天天气的软件模拟一样。超级计算应用需要在数值方法方面具备特殊的编程技能,包括使用数字近似算法求解复杂方程、验证算法以及检测和利用其中的并行性。
在集群架构上,超级计算应用历史上取得了成功。因为大量计算机通常能比同等成本的单个处理器表现更出色,使得集群计算机成为最优选择。例如,NASA的Beowulf项目在1994年启动,使用高端PC和专用通信设备组装了一个16节点的超级计算机,成本仅为同等性能单台计算机的十分之一。后来,研究人员增加了节点数量,并解决了由此产生的瓶颈问题,不断提高收益递减点。
当应用程序中的固有并行性有限时,可扩展性对超级计算机来说就不那么重要了。并行性通常通过在多个节点上调度相同的指令块来实现,每个指令块处理不同的数据子集。如果指令块的最大数量不超过7个,系统架构师就无需将收益递减点扩展到该数量之外。同样,如果系统中可用节点的最佳数量超过指令块的最大数量,系统就具有内置的容错和高可用性。
2.2 事务处理应用
超级会员免费看
订阅专栏 解锁全文
2856

被折叠的 条评论
为什么被折叠?



