检查环境
查看是否安装了cuda和cudnn
cudnn的检查可以参考这个博客: https://blog.youkuaiyun.com/qq_
40968179/article/details/124240224
然后cuda 和 cudnn安装的可以参考这个博客:
https://blog.youkuaiyun.com/anmin8888/article/details/127910084
创建虚拟环境
根据模型的需要创建虚拟环境(这里我们以一个联邦学习的代码为例,代码地址:https://github.com/shaoxiongji/federated-learning)
conda create -n FL python=3.8
其中FL是自己的环境名字,python版本是按照模型对应去指定(注意创建的时候关VPN,不然会创建失败),类似下面这种情况:
成功的安装:
激活虚拟环境
如果是自己的电脑(Windows电脑)用以下命令:
conda activate FL
如果是服务器(Linux)用以下命令激活环境:
source activate FL
下载模型需要的环境
我们可以查看代码的README.txt 和 requirements.txt 两个文件去创建环境。
首先看README.txt:
然后看requirements.txt文件:
然后再看自己的cuda版本
nvidia-smi
得知下载的命令行为:
pip install torch==0.4.1+cu121 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna.tsinghua.edu.cn/simple
【说明】:其中-f https://download.pytorch.org/whl/torch_stable.html 是指定到pytoch官网下载对应的包,然后-i https://pypi.tuna.tsinghua.edu.cn/simple 是指定镜像;
开始报错
【报错!!】这里我们发现原来这个仓库比较老,而我们能装的最低版本也是torch==1.4.0!!
故而去官网查找过去的版本: https://pytorch.org/get-started/previous-versions/
终于,滑到下面我们发现
这里我们需要的是cuda 9.2 和 python 3.7 (无语,但是装环境就是这么麻烦….),注意,cuda是可以向下兼容的,所以如果你cuda版本是12.1,你也可以装cuda 9.2的pytoch !!
这里我们需要重新装虚拟环境:
conda create -n FL2 python=3.7
然后激活:
conda activate FL2
【重点!!】开始装环境
pip install http://download.pytorch.org/whl/cu92/torch-0.4.1-cp37-cp37m-win_amd64.whl
torch==0.4.1 安装成功!!
开始安装torchvision==0.2.1!!
pip install torchvision==0.2.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
到此,环境安装成功,我们去测试一下代码!!
下载遗漏的包
这里我们可以看到matplotlib没找到,说明我们没有下载,所以提前去下载着
pip install matplotlib
没报错了
解决代码报错!!
这里就是大部分靠经验了,出现以下错误,原因是PILLOW_VERSION 已经在新版中删除了
博客地址: https://www.jianshu.com/p/8b239ebe4683
故降低pillow版本即可
pip install pillow==6.2.1
再去跑代码试试!!不断试错,不断改正即可!!
成功运行!!
但是,别高兴太早,好像又出现新的问题,红红火火恍恍惚惚
这里显示我们没找到对应的文件夹,即log文件夹,我们可以自己创建一个!!(有时候是这样的,作者的文件夹删了一些,然后上传,最后有些文件夹没找到,就会报这个错误)
新建log文件夹
然后再跑即可成功!!