一、首先得安装好miniconda3,可以看下述博客进行安装
下述例子,只看到第8步即可。如果决定按照本文使用conda安装torch,后续附录直接忽略。
二、确保Ubuntu已经安装nvidia驱动
我目前安装的是nvidia-535驱动,CUDA版本是12.2。
Ubuntu安装nvidia驱动还是很简单的,直接在软件升级设置里,有个附加驱动的选项,选择稳定版本的驱动安装即可。记得安装完后一定要按照提示重启!!!
这里我直接放网上类似的图片,在这个界面下选择安装即可。
三、创建conda虚拟环境
当前比较稳定的是torch2.1.2版本。torch.compile的加速功能只在Linux环境下可用,Windows就别想了。
conda create -n torch2.1 python=3.11 -y
四、安装torch2.1.2
这是官方的安装命令,因为通过-c参数从官方源下载,所以速度贼慢,但能保证环境配置的稳定性。
最好是安装cuda11.8的版本,cuda12.1在compile的时候总是有各种奇怪的bug。
conda install pytorch==2.1.2 pytorch-cuda=11.8 -c pytorch -c nvidia
当然,深度学习环境通常少不了torchmetrics,tensorboard,tensorboardX这几个包。
conda install torchmetrics tensorboard tensorboardX
五、安装cudatoolkit和cudnn
conda install cudatoolkit cudnn
因为安装pytorch时已经指定了cuda11.8版本,这里会自动匹配cudatoolkit和cudnn的版本。
六、日常工作会用的包
其它可能用到的包也可以直接安装了,看个人需要吧
conda install netcdf4 h5py haversine scipy openpyxl pyyaml tqdm pandas playsound scikit-learn
conda install seaborn matplotlib cartopy