1. worker 是一个分布式概念,在(nts)等通用的含义是 :一个CPU和一个GPU 组成一个worker 搭配用于训练
2. 单机单worker(简称"单机"): 一个CPU 一个 GPU一起配合进行训练
单机多卡:一个CPU 多个 GPU一起配合进行训练
多机多worker(简称“多机”):多个worker 一起训练,每个worker还是一个CPU配合一个GPU训练
3. nts 中的MPI是用于连接多个worker的 ~
本文介绍了在分布式训练中worker的概念及其不同配置方式,包括单机单worker、单机多卡和多机多worker等模式,并解释了MPI在连接多个worker中的作用。
1. worker 是一个分布式概念,在(nts)等通用的含义是 :一个CPU和一个GPU 组成一个worker 搭配用于训练
2. 单机单worker(简称"单机"): 一个CPU 一个 GPU一起配合进行训练
单机多卡:一个CPU 多个 GPU一起配合进行训练
多机多worker(简称“多机”):多个worker 一起训练,每个worker还是一个CPU配合一个GPU训练
3. nts 中的MPI是用于连接多个worker的 ~
您可能感兴趣的与本文相关的镜像
Wan2.2-I2V-A14B
Wan2.2是由通义万相开源高效文本到视频生成模型,是有50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力
2376
1433
1408

被折叠的 条评论
为什么被折叠?