云服务器Ubuntu20.04配置NVIDIA驱动+CUDA+cudnn+Anaconda

踩坑很多次,并且重装多次系统后,含泪记录!!!!

云服务器申请下来,没有NVIDIA驱动,使用nvidia-smi验证。

nvidia-smi

如果未识别命令,那么证明你的系统没有NVIDIA支持的驱动。

查看你服务器支持的NVIDIA驱动版本,查看你的显卡型号就行了,下载驱动的时候需要你的显卡版本。

lspci | grep -i nvidia

查看你的Linux版本号、gcc版本以及Ubantu版本。

cat /proc/version

安装NVIDIA驱动

NVIDIA驱动下载地址:GeForce® 驱动程序

进去界面后,按照之前获得的显卡型号、系统版本等填写,填写完成后,点击开始搜索,之后按需下载。

不要禁用nouveau!!!!!!!!!!!!

就是这个禁用,因为原先用的服务器都是实体机并且配备屏幕(有图形界面的那种),所以我依旧哼着小曲,按照收藏的教程一步一步操作,禁用nouveau最后一步要重启reboot,我也是丝毫不犹豫,输入命令按下回车,结果!!!!!!悲剧了,云服务器SSH连接断开了,而且重启之后还是连接不上,最后无奈重装系统才重新连上。

所以也是又学习到了,云服务器不要使用reboot进行重启,会导致数据丢失,或者系统崩溃。

所以在这部分在云服务器上是不用配置的。(至少不要重新启动,或者在控制台进行重启)

因为是云服务器所以也没有图形界面,禁用图形界面的操作也就省略了。

cd到你下载驱动的文件路径

给你下载的NVIDA驱动添加权限:

sudo chmod  a+x NVIDIA-Linux-x86_64-525.105.17.run 

安装,不需要X校验,不需要安装Opengl

sudo ./NVIDIA-Linux-x86_64-525.105.17.run -no-x-check  -no-opengl-files

–no-opengl-files 参数必须加否则会循环登录,也就是loop login

安装过程中会出现很多的选项页面,我只列出我遇到的,而且个人建议遇到没有见过的页面,直接去上网查看如何选择。

查看GCC是否安装

gcc --version

没有用反应,表示服务器未安装GCC

安装gcc

sudo apt install gcc

 继续安装显示了

代表未安装make

sudo apt install make

 继续安装

 选择OK

选择NO

 

选择 Rebuild initramfs

选择Yes 

显示安装成功,选择OK

验证安装

nvidia-smi

 

证明安装成功

安装 CUDA

我的项目需要再CUDA11.8环境下运行,所以安装CUDA11.8

进入CUDA官网:CUDA Toolkit Archive

选择你需要的版本,我这里选11.8

跳转到如下界面

通过他给出的 Installation Instructions进行安装,这个连接的下载速度还是很快的,稍等一下就行可以下载成功。文件比较大,安装成功后可以移除。

输入accept

因为已经安装了驱动,所以不选则Driver,选择Install 

验证CUDA安装

nvcc -V

未显示CUDA版本

添加系统路径

进入bashrc文件

sudo nano ~/.bashrc	

在最后添加

#将下面两行插入到文件末尾
export PATH=/usr/local/cuda-11.8/bin:$PATH						
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

 Ctrl+X,按Y,按回车

source ~/.bashrc	#更新文件

再次验证CUDA安装

nvcc -V

 

证明安装成功 

安装cudnn

进入cudnn的官网:cuDNN Archive

选择CUDA的对应的版本和系统对应的版本下载

解压下载的文件

tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda11-archive.tar.xz

进入文件夹

cd cudnn-linux-x86_64-8.9.7.29_cuda11-archive
sudo cp include    /usr/local/cuda-11.8/include
sudo cp lib/libcudnn*    /usr/local/cuda-11.8/lib64
sudo chmod a+r /usr/local/cuda-11.8/include/cudnn.h   /usr/local/cuda-11.8/lib64/libcudnn*

验证是否安装成功

cat /usr/local/cuda-11.8/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

安装成功

Anaconda安装

 进入镜像网站下载:Anaconda版本

下载你需要的版本后设置权限

 sudo chmod +x Anaconda3-2024.06-1-Linux-x86_64.sh
sudo sh Anaconda3-2024.06-1-Linux-x86_64.sh

输入yes

输入回车

输入回车

验证是否安装成功

conda activate

添加系统路径

sudo nano ~/.bashrc

在最后添加

export PATH="$HOME/anaconda3/bin:$PATH"

 更新环境

source ~/.bashrc

再次验证

conda activate

conda init

 

source ~/.bashrc

 

成功安装。

至此NVIDIA驱动、CUDA、 cudnn和Anaconda都已安装成功!!!!!!!!!

### Ubuntu 20.04 双系统下 NVIDIA 驱动CUDAcuDNN 和 PyTorch 的安装教程 #### 一、NVIDIA 驱动安装 在双系统环境下,确保硬件兼容性和驱动正常工作至关重要。以下是具体的步骤: 1. 打开 **系统设置 -> 软件和更新 -> 附加驱动**,查看推荐的 NVIDIA 显卡驱动版本并选择合适的选项(如引用中提到的选择了 510 版本驱动),点击“应用更改”,等待安装完成[^1]。 2. 安装完成后,重启计算机以使新驱动生效。可以通过运行以下命令验证驱动是否成功安装: ```bash nvidia-smi ``` 如果返回的信息包含 GPU 型号、温度和其他参数,则说明驱动已正确安装[^3]。 --- #### 二、CUDA 工具包安装 为了支持深度学习框架,需安装 CUDA 工具包。具体操作如下: 1. 访问 NVIDIA 官方网站获取适合的操作系统和架构对应的 CUDA 下载链接。例如,在引用中提供了 CUDA 11.6.0 的 runfile 文件下载地址[^2]: ```bash wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run ``` 2. 使用 `sudo` 权限执行安装脚本: ```bash sudo sh cuda_11.6.0_510.39.01_linux.run ``` 3. 检查环境变量配置文件 `/etc/profile.d/cuda.sh` 是否存在,并将其路径加入到 `.bashrc` 中以便加载 CUDA 库: ```bash echo 'export PATH=/usr/local/cuda-11.6/bin:$PATH' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc source ~/.bashrc ``` 4. 测试 CUDA 安装情况: ```bash nvcc --version ``` --- #### 三、cuDNN 安装 cuDNN 是用于加速神经网络计算的重要库,其安装依赖于已经成功的 CUDA 环境搭建。 1. 登录 NVIDIA 开发者账户后,下载对应版本cuDNN tarball 文件(假设为 v8.x 对应 CUDA 11.6)。 2. 解压压缩包并将内容复制至 CUDA 安装目录: ```bash tar -xzvf cudnn-linux-x86_64-*.*-*-*.tgz sudo cp cuda/include/* /usr/local/cuda-11.6/include/ sudo cp cuda/lib64/* /usr/local/cuda-11.6/lib64/ ``` 3. 更新权限以允许访问这些资源: ```bash sudo chmod a+r /usr/local/cuda-11.6/include/cudnn*.h sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn* ``` --- #### 四、Anaconda 和 PyTorch 配置 通过 Anaconda 创建虚拟环境可以简化管理多个 Python 包的过程。 1. 安装最新版 Anaconda 或 Miniconda 并创建一个新的 conda 环境: ```bash conda create -n torch_env python=3.9 conda activate torch_env ``` 2. 在激活环境中安装 PyTorch,指定与当前 CUDA 版本匹配的构建方式。例如对于 CUDA 11.6,可使用 pip 进行安装: ```bash pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu116 ``` 3. 验证 PyTorch 是否能够检测到 GPU 加速功能: ```python import torch print(torch.cuda.is_available()) print(torch.__version__) ``` 如果上述两行均输出 True 和正确的 PyTorch 版本号,则表明一切准备就绪。 --- #### 五、注意事项 - 若遇到任何错误提示,请仔细核对每一步骤中的细节,尤其是版本一致性问题; - 不同型号显卡可能需要调整特定驱动程序或工具链组合来达到最佳性能表现。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值