Add MPI Support for tp-comm-overlap and Cpu-Offload for Mcore Distrib… by jerryli1981 · Pull Request #283 · alibaba/Pai-Megatron-Patch · GitHub 以上是在 llama-70B 上实现的 cpu-offload 方法。 下面是在主分支上,仿照 LLaMA-70B,在 Qwen2 上实现 cpu-offload 代码。 1、optimizer选项设置:argument.py加入optimizer参数(cpu-adam) 2、optimizer初始化方法:__init__.py加入'cpu-adam'参数加载CPUAdam