高性能PC集群中的网络技术解析
1. TCP/IP协议模拟
面向连接的局域网网络协议对于PC集群至关重要,关乎其商业可行性。大多数协议栈和通用的套接字API由PC或工作站的默认操作系统提供,许多使用这些协议和套接字接口的软件包也已存在。有项目的目标不仅是为计算化学、计算生物学或计算天文学等应用提供更廉价的每秒千兆浮点运算能力,还想将可并行化应用的范围从科学代码扩展到数据库和互联网服务器。对于商业分布式数据库或现有的对象存储中间件系统,将标准通信协议改为受限的高速消息传递并不可行。对于PC集群上的网络文件系统,如NFS或Sprite,必须同时提供UDP/IP和TCP/IP服务。通过千兆互连的高度优化的IP通信设施,PC集群能以最优价格为更多程序提供高计算性能,这是专用工作站集群无法比拟的。传统的工作站集群,如IBM SP/2,只为为消息传递通信重新编码的并行程序提供高通信速度。
TCP/IP协议套件主要为互联网通信设计,不太适合并行系统中的消息传递通信。不过,借助底层的IP消息传递机制,它可以通过将消息分割成IP数据报并根据IP地址方案进行传递,提供一些快速、不可靠、无连接的网络服务。像UDP和TCP这样的传输协议通过称为套接字的通用端口概念,将通信扩展到同一终端系统的不同进程。TCP通过使用滑动窗口协议实现流量控制和重传,进一步实现了可靠数据流上的全双工通信。在集群互连中,TCP的后一种功能不太重要(如果高速互连设置得当,交换机中不应有数据丢失),但其API非常常见。
由于该协议在实现时没有考虑所使用硬件的具体信息,假设使用的是像以太网或互联网这样不可靠的网络服务,IP的性能很少能与优化的MPI和直接存款协议相媲美。特别是TCP数据传输的延迟因连接建立而高很多,这对某些应用来说可
高性能PC集群网络技术解析与选择
超级会员免费看
订阅专栏 解锁全文
2984

被折叠的 条评论
为什么被折叠?



