FaSST RPCs性能分析与特性详解
1. 实验环境
- 硬件配置 :
- 采用Intel SandyBridge 8核CPU。
- CIB是一个拥有11个节点的私有集群,其节点配备更强大的Connect - IB NIC,相比ConnectX - 3 NIC,带宽提升2倍,消息速率提高约4倍,还搭载14核的Intel Haswell CPU。
- 实验设置 :
- 采用对称设置的机器集群,每台机器向其他机器发出请求(RPC请求或READ操作)。
- 对于不共享QP的READ操作,每个线程创建的RC QP数量与机器数量相同,并向随机选择的机器发出READ请求。
- 评估两种请求批量大小(1和11)下的RPC性能,以展示门铃批量处理请求的效果。为防止RPC请求合并,将批量中的每个请求发送到不同的机器,这限制了CIB上的最大批量大小为11。
2. 实验结果
- FaSST RPC吞吐量表现 :
- 对于小消息(最多56字节),在小集群中,RPC在CX3上可达到类似大小READ最大吞吐量的103 - 106%,在CIB上为68 - 80%,具体取决于请求批量大小。考虑到访问实际数据存储中数据结构所需的READ大小或数量的放大,RPC的原始吞吐量高于READ。
- 在中型集群中,如果R
超级会员免费看
订阅专栏 解锁全文
19

被折叠的 条评论
为什么被折叠?



