ubuntu 18.04 pytorch 的 cuda 环境搭建(亲测)

本文详细介绍了如何在Linux环境下安装NVIDIA驱动、CUDA 10、cuDNN 7.4.1及PyTorch 1.0.0,包括卸载旧驱动、禁用nouveau驱动、安装驱动和CUDA工具包、配置环境变量等步骤,并提供了测试安装是否成功的命令。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本人装的是410N卡驱动,cuda版本为10,cudnn版本为7.4.1,pytorch1.0.0

 

 一.下载

N卡410驱动下载    

cuda_10.0.130_410.48_linux.run      N卡驱动版本至少410.48 

cudnn-10.0-linux-x64-v7.4.1.5.tgz    7.4.1版本对应cuda 10     需要注册账号

pytorch-1.0.0-py3.6_cuda10.0.130_cudnn7.4.1_1.tar.bz2      对应py3.6   cuda 10 cudnn 7.4.1  的1.0.0版本

 

 二.安装N卡驱动  (来源)

1. 先卸载原有N卡驱动

复制代码

#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*

#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-384.59.run --uninstall

复制代码

 

如果原驱动是用apt-get安装的,就用第1种方法卸载。 
如果原驱动是用runfile安装的,就用–uninstall命令卸载。其实,用runfile安装的时候也会卸载掉之前的驱动,所以不手动卸载亦可

2. 禁用nouveau驱动

sudo gedit /etc/modprobe.d/blacklist.conf

 

在文本最后添加:(禁用nouveau第三方驱动,之后也不需要改回来)

blacklist nouveau
options nouveau modeset=0

 

然后执行:

sudo update-initramfs -u

 

重启后,执行:lsmod | grep nouveau。如果没有屏幕输出,说明禁用nouveau成功。

3. 禁用X-Window服务  (我的提示我没有x-window我没管)

sudo service lightdm stop #这会关闭图形界面,但不用紧张

 

Ctrl-Alt+F1进入命令行界面,输入用户名和密码登录即可。

小提示:在命令行输入:sudo service lightdm start ,然后按Ctrl-Alt+F7即可恢复到图形界面。

4. 命令行安装驱动

sudo ./NVIDIA-Linux-x86_64-410.73.run --no-opengl-files
  • –no-opengl-files:表示只安装驱动文件,不安装OpenGL文件。这个参数不可省略,否则会导致登陆界面死循环,英语一般称为”login loop”或者”stuck in login”。
  • –no-x-check:表示安装驱动时不检查X服务,非必需。
  • –no-nouveau-check:表示安装驱动时不检查nouveau,非必需。
  • -Z, --disable-nouveau:禁用nouveau。此参数非必需,因为之前已经手动禁用了nouveau。
  • -A:查看更多高级选项。

必选参数解释:因为NVIDIA的驱动默认会安装OpenGL,而Ubuntu的内核本身也有OpenGL、且与GUI显示息息相关,一旦NVIDIA的驱动覆写了OpenGL,在GUI需要动态链接OpenGL库的时候就引起问题。

之后,按照提示安装,成功后重启即可。 
如果提示安装失败,不要急着重启电脑,重复以上步骤,多安装几次即可。

Driver测试:

nvidia-smi #若列出GPU的信息列表,表示驱动安装成功
nvidia-settings #若弹出设置对话框,亦表示驱动安装成功

 三.安装CUDA 

sudo ./cuda_10.0.130_410.48_linux.run     --no-opengl-libs
  • --no-opengl-libs:表示只安装驱动文件,不安装OpenGL文件。必需参数,原因同上。注意:不是-no-opengl-files
  • --uninstall (deprecated):用于卸载CUDA Driver(已废弃)。
  • --toolkit:表示只安装CUDA Toolkit,不安装Driver和Samples。
  • --help:查看更多高级选项。

之后,按照提示安装即可。我依次选择了:

复制代码

1 accept #同意安装
2 n #不安装Driver,因为已安装最新驱动
3 y #安装CUDA Toolkit
4 <Enter> #安装到默认目录
5 y #创建安装目录的软链接
6 y #复制Samples一份到家目录

复制代码

之后声明一下环境变量,并将其写入到 ~/.bashrc 文件(在用户目录下)的尾部,输入内容如下

export PATH=/usr/local/cuda-10.0/bin${PATH:+:$PATH}} 
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存退出,并输入下面指令使环境变量立刻生效:

$source ~/.bashrc

设置环境变量和动态链接库,在命令行输入:

$ sudo vim /etc/profile

在打开的文件末尾加入:

export PATH=/usr/local/cuda/bin:$PATH


创建链接文件

$ sudo vim /etc/ld.so.conf.d/cuda.conf

在打开的文件中添加如下语句:

/usr/local/cuda/lib64

保存退出,然后执行

$ sudo ldconfig 

使链接立即生效。

CUDA Sample测试:

切换到 CUDA 10.0 Samples 默认安装路径(即在/home/用户/NVIDIA_CUDA-9.1_Samples 目录下), 终端下输入

$ cd NVIDIA_CUDA-10.0_Samples
$ sudo make all -j4
$ cd bin/x86_64/linux/release
$ ./deviceQuery

如果 CUDA 安装成功,则有:

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce GTX 1060 6GB"
  CUDA Driver Version / Runtime Version          10.0 / 10.0
  CUDA Capability Major/Minor version number:    6.1
  Total amount of global memory:                 6075 MBytes (6370295808 bytes)
  (10) Multiprocessors, (128) CUDA Cores/MP:     1280 CUDA Cores
  GPU Max Clock rate:                            1772 MHz (1.77 GHz)
  Memory Clock rate:                             4004 Mhz
  Memory Bus Width:                              192-bit
  L2 Cache Size:                                 1572864 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  2048
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 2 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device supports Compute Preemption:            Yes
  Supports Cooperative Kernel Launch:            Yes
  Supports MultiDevice Co-op Kernel Launch:      Yes
  Device PCI Domain ID / Bus ID / location ID:   0 / 31 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS

 

四.安装cudnn

下载完毕后,切到默认的Downloads文件夹,可以看到 cudnn-10.0-linux-x64-v7.4.1.5.tgz 压缩包

先解然后复制cuDNN内容到cuda相关文件夹内

sudo cp cuda/include/cudnn.h    /usr/local/cuda/include      注意,解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda内
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h   /usr/local/cuda/lib64/libcudnn*


五.安装pytorch

下载后  直接pip安装

conda install pytorch-1.0.0-py3.6_cuda10.0.130_cudnn7.4.1_1.tar.bz2

六.测试

import torch
torch.cuda.is_available()  # True
### 安装 PyTorch 的具体方法 要在 Ubuntu 18.04 上成功安装 PyTorch 并实现 GPU 加速功能,需按照以下流程操作。 #### 显卡驱动程序的安装 为了使 PyTorch 能够利用 NVIDIA GPU 进行计算,必须先安装合适的显卡驱动程序。这一步骤对于启用 CUDA 支持至关重要[^1]。可以通过官方文档或其他教程完成此部分设置。 #### 编译工具链准备 在正式安装之前,还需要确保系统已安装必要的编译器及相关开发工具。这些工具包括但不限于 `make`、`gcc` 和 `g++`。通过执行如下命令来安装它们: ```bash sudo apt update && sudo apt upgrade -y sudo apt install make gcc g++ ``` 上述步骤能够提供构建 Python 扩展模块所需的环境支持[^3]。 #### 配置并安装 PyTorch 针对不同硬件条件可以选择不同的安装方式: - **仅 CPU 版本** 如果目标设备不包含 NVIDIA GPU 或者不需要 GPU 加速,则可以直接下载预编译好的 wheel 文件并通过 pip 工具完成安装过程。例如,在 Python 3.6 环境下可采用下列指令: ```bash cd /path/to/wheel/file/ sudo pip install torch-1.8.0+cpu-cp36-cp36m-linux_x86_64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple/ ``` 此处 `/path/to/wheel/file/` 应替换为实际存放 `.whl` 文件的具体路径[^2]。 - **含 GPU 支持版本 (CUDA)** 当希望充分利用 NVIDIA 图形处理器提升性能时,推荐依据个人计算机所搭载之 CUDA Toolkit 版本来决定最终使用的 PyTorch 构建选项。假设当前环境中存在兼容性的 CUDA 10.1 SDK 及其对应驱动,则可通过 Anaconda 创建独立虚拟空间后再引入相应依赖项;或者直接借助 conda 命令快速部署整个框架结构。 另外需要注意的是,某些情况下可能需要调整默认包管理源地址以便提高访问速度与稳定性[^4]。 最后提醒一点,无论采取哪种方案都务必确认所有前置组件均已妥善安置完毕之后再继续后续动作!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值