用于 SCI 集群的 MuSE 运行时系统:栈上执行与工作窃取的灵活结合
在分布式系统的发展中,Scalable Coherent Interface(SCI)技术凭借其高带宽、低延迟以及支持共享内存通信范式的特性,为网络工作站和 PC 集群带来了新的执行模式。今天要介绍的 MuSE(Multithreaded Scheduling Environment)运行时系统,就是充分利用 SCI 技术特性的一个典范,它通过栈上执行和工作窃取的灵活结合,实现了高效的负载均衡和任务调度。
1. SCI 技术与 MuSE 系统概述
SCI 技术不仅具备高带宽和低延迟的优势,还能在分布式系统中实现共享内存通信范式,使网络工作站和 PC 基本能转变为 NUMA 机器,从而开启了原本在普通网络工作站中难以实现的替代执行模型。
MuSE 系统正是基于 SCI 技术的特性而设计的分布式运行时系统,它将数据流自调度、多线程执行和共享内存通信三种范式相结合,每种范式都相互支持。多线程执行能隐藏分布式共享内存通信中的远程访问延迟,还能减少数据流调度的开销;数据流则为线程的自控制负载均衡提供了简单准则,并且借助 SCI 的远程内存存储操作,可轻松实现典型的数据流通信结构。MuSE 系统的服务涵盖了大多数运行时系统常见的功能,如机器虚拟化、内存管理、负载均衡和调度等。
2. SMiLE 集群
SMiLE 是“Shared Memory in a LAN - like Environment”的缩写,该项目利用 SCI 互连技术将 PC 集群化,其具有三个主要目标:
- 开发硬件以推动 SCI 技术的应用和发展。
- 开发软件,为新型 SCI 集群系