[细读经典]Megatron论文和代码详细分析(5)-T5-part 1-启动环境-data/tensor/pipeline并行 - 知乎 [细读经典]Megatron论文和代码详细分析(2) - 知乎 megatron学习总结 - 知乎