在linux服务器上部署torch开发环境踩坑汇总
首先来看显卡版本信息
报错信息,显示cuda版本不匹配问题
服务器显卡显示的cuda最高适配版本为10.2,去官网寻找对应的版本下载(https://pytorch.org/get-started/previous-versions/#osx-9)
下载完成后测试cuda可以使用,问题解决

报错信息

这个问题一直没有解决,无赖破防,重头来过使用conda配置环境
conda create -n mmgen python=3.8
conda activate mmgen
conda install pytorch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 cudatoolkit=10.2 -c pytorch
pip uninstall mmcv-full
pip uninstall mmcv
pip install mmcv-full==1.5.0 -f https://download.openmmlab.com/mmcv/dist/cu102/torch1.11.0/index.html
pip install mmgen==0.6.0
最后运行代码,没有报错则环境部署成功
import torch, torchvision
import mmcv
from mmgen.apis import init_model, sample_unconditional_model
print('mmgen载入成功!')
在Linux服务器上部署Torch开发环境时遇到CUDA版本不兼容的问题,通过更新CUDA至10.2并下载对应版本的PyTorch解决了问题。然而,后续出现libcudart.so.11.0错误,选择使用conda创建环境,安装了pytorch=1.11.0,torchvision=0.12.0,torchaudio=0.11.0,cudatoolkit=10.2,以及mmcv和mmgen的特定版本。最终运行代码成功,环境部署完成。
1891

被折叠的 条评论
为什么被折叠?



