分布式与云计算系统的技术解析
1. 计算网格与网格家族
1.1 计算网格
计算网格类似于电力电网,它提供了一种将计算机、软件/中间件、特殊仪器、人员和传感器连接在一起的基础设施。这种网格通常会跨越局域网(LAN)、广域网(WAN)或互联网骨干网络,在区域、国家甚至全球范围内构建。企业或组织将网格视为集成的计算资源,也可将其看作支持虚拟组织的虚拟平台。
计算网格中使用的计算机主要包括工作站、服务器、集群和超级计算机。个人计算机、笔记本电脑和个人数字助理(PDA)可作为访问网格系统的设备。例如,图中展示的计算网格是在多个不同组织拥有的资源站点上构建的,这些资源站点提供互补的计算资源,如工作站、大型服务器、处理器网络和Linux集群,以满足一系列计算需求。
网格将计算、通信、内容和交易作为租赁服务进行整合。企业和消费者构成了用户基础,从而决定了使用趋势和服务特性。以下是关键集群设计问题及可行实现方式的表格:
| 特性 | 功能描述 | 可行实现方式 |
| — | — | — |
| 可用性和支持 | 为集群中的持续高可用性提供硬件和软件支持 | 故障转移、故障恢复、检查点、回滚恢复、不间断操作系统等 |
| 硬件容错 | 自动进行故障管理,消除所有单点故障 | 组件冗余、热插拔、RAID、多个电源等 |
| 单一系统映像(SSI) | 通过硬件和软件支持、中间件或操作系统扩展在功能层面实现SSI | 硬件机制或中间件支持,在一致缓存级别实现分布式共享内存(DSM) |
| 高效通信 | 减少消息传递系统开销并隐藏延迟 | 快速消息传递、主动消息、增强的MPI库等 |
| 集群范围的作业管理
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



