[大模型] 搭建llama主流大模型训练环境
于 2023-05-10 19:22:19 首次发布
该文介绍了在Ubuntu18.04系统上,使用4块A100GPU进行大模型LLAMA的训练环境配置,包括CUDA、cuDNN和nccl的安装。接着,详细阐述了如何将LLAMA模型转换为HuggingFace的格式,并使用fork版的transformers进行加载。最后,提到了基于转换后的模型进行再训练或finetuning的准备步骤。

最低0.47元/天 解锁文章
728

被折叠的 条评论
为什么被折叠?



