DeepSeek 开源周第二天开源项目 DeepEP 最大亮点就是DeepEP是首个开源的 MoE 模型训练和推理的 EP 通信库 特点 ✅ 高效优化的全对全通信 ✅ 支持节点内和节点间通信,兼容 NVLink 和 RDMA ✅ 高吞吐量的内核,用于训练和推理前置填充 ✅ 低延迟内核,用于推理解码 ✅ 原生 FP8 调度支持 ✅ 灵活的 GPU 资源控制,支持计算与通信的重叠 github https://github.com/deepseek-ai/DeepEP 性能 Low-latency kernels with pure RDMA 太强了!!!deepseek !!! 参考 https://github.com/deepseek-ai/DeepEP