SCI、Myrinet和SGI/Cray的性能比较
1. DMA传输与块大小的影响
直接DMA传输存在过多DMA初始化和PCI总线仲裁开销的问题。而缓冲区打包的原生模式能够充分利用DMA,提升大连续块数据的传输性能。
DMA传输性能受块大小的影响很大。Myrinet和SCI在不同块大小下的性能对比如下:
| 适配器 | 小块数据问题 | 改进情况 |
| ---- | ---- | ---- |
| Myrinet | 存在小块数据传输问题 | 未提及 |
| SCI | 存在小块数据传输问题 | 第二代“CluStar” SCI适配器在小传输的启动开销方面比第一代有显著提升 |
2. 不同系统的数据存储性能
2.1 SCI系统
在直接传输模式下,SCI互连对于连续块数据能展现出相当不错的性能,此时八个流缓冲区能实现最优工作状态。然而,对于跨步数据,PCI上的远程存储性能会骤降至10 MByte/s以下,并且表现不稳定。从跨步2到跨步8的斜率曲线可以通过流缓冲区的机制来解释。当跨步为2时,似乎仅使用了一个流缓冲区,后续偶数字对齐的远程内存地址直接映射到同一个64字节流缓冲区,必然导致一系列非流水线单字传输。缓冲区总是仅携带8字节数据直接发送,而指向同一缓冲区的下一个值必须等待返回的确认信号释放缓冲区后才能继续传输。尽管SCI表面上支持单字的直接传输,但实际上打包和解包通信缓冲区比直接执行跨步传输更为高效,这种传输模式与性能的权衡与Myrinet类似。
2.2 Cray T3D系统
Cray T3D呈现出截然不同的性能表现。对于Cray T3D而言,始