1、默认安装完成conda
2、conda create --name myenv python=3.8
3、pytorch安装
先nvidia-smi查看cuda版本
然后去pytorch官网
命令如:conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
4、安装transformers
pip install transformers
5、pip install accelerate
6、pip install -i https://pypi.org/simple/ bitsandbytes
注意bitsandbytes没有空格报错
安装完成第六步之后应该可以正常预测了,下面是用来进行训练的相关环境
7、 pip install peft
pip install datasets
(接下来发现第15步的报错报错,这里8-14步都是认为是deepspeed报错,尝试d安装eepspeed,未解决后回退,不安装可以直接跳到15步)
8、运行程序cuda报错有可能是deepspeed没装或者内存不够
(需要pip install deepspeed,继续报错)
9、安装deepspeed不能用torch内置的cuda,需要再安装一版本cuda
需要坚持版本是使用apt还是yum来进行cuda安装
(yum install nvidia-cuda-toolkit
发现yum报错:CRYPTO_num_locks
10、解决yum报错,原因是链接到conda中的库了,但机器的python版本不一致
首先查看报错位置
ldd /usr/lib64/p
大模型conda环境安装步骤
于 2024-05-07 11:20:48 首次发布