2020深度学习平台搭建

本文详细介绍了如何在Ubuntu16.04上安装CUDA10.2和miniconda,包括禁用nouveau驱动,安装CUDA10.2、cuDNN以及miniconda的具体步骤。适用于希望在Linux环境下进行深度学习开发的用户。
部署运行你感兴趣的模型镜像

准备事项

Ubuntu16.04
烧录并安装

CUDA 10.2
https://developer.nvidia.com/cuda-10.2-download-archive
选择 Liunx+x86_64+Ubuntu+16.04+runfile(local)
并下载 run file:
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run

cuDNN
登陆后下载三个文件
Download cuDNN for CUDA 10.2

  • cuDNN Code Samples and User Guide for Ubuntu16.04 (Deb)
  • cuDNN Runtime Library for Ubuntu16.04 (Deb)
  • cuDNN Developer Library for Ubuntu16.04 (Deb)

miniconda
下载 : https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

安装

  1. 按 Ctrl +alt +F1 进入命令行模式
  2. 关闭图形界面,禁用并删除nouveau (简单介绍一下nouveau,简单来说它和nvidia系列有冲突,不禁用的话可能会导致黑屏或循环登陆,因此一定要禁掉或者删掉,这里是完全删除)
    sudo service lightdm stop #关闭图形界面
    sudo modprobe -r nouveau #将nouveau彻底干掉
    lsmod | grep nouveau #返回空说明nouveau已经清理干净
  3. 安装CUDA10.2 (使用10.2 的run文件里自带的显卡驱动可减少不必要的兼容问题)
    sudo ./cuda_10.0.130.1_linux.run
  4. 安装界面下的options里面选择禁用opengl
  5. 其他包括显卡驱动都默认全部安装
  6. 安装 patch for CUDA10.2
  7. 安装完成后重启
  8. Install cuDNN
    ‘sudo dpkg -i libcudnn7_7.6.0.64-1+cuda10.0_amd64.deb’
    ‘sudo dpkg -i libcudnn7-dev_7.6.0.64-1+cuda10.0_amd64.deb’
    ‘sudo dpkg -i libcudnn7-doc_7.6.0.64-1+cuda10.0_amd64.deb’
  9. 安装 miniconda
    sudo anacondaXXX.sh
  10. 检测GPU是否识别并安装 nvidia-smi
    nvidia-smi

PS: 双显卡的笔记本电脑还无法找到解决方案

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

### 如何搭建深度学习训练平台 #### 硬件选型 构建高效的深度学习训练平台,硬件的选择至关重要。对于需要较高计算能力的场景,建议选用具备强大处理能力和大容量显存的图形处理器(GPU)。例如,NVIDIA RTX 3080、RTX 3090以及最新的RTX 4090都是理想的选择[^3]。这些型号不仅拥有更多的CUDA核心来加速并行运算,还配备了充足的视频随机存储器(VRAM),这对于加载大型数据集和运行复杂的神经网络模型尤为重要。 如果目标是建立一个更为专业的高性能实验室环境,则可以考虑采用类似UltraLAB GT410P这样的高端设备,它最多可容纳5到7块GPU,非常适合那些追求极致性能的研究团队或企业级应用需求[^2]。 #### 软件配置 完成硬件采购之后,接下来就是安装操作系统和支持软件。通常情况下,Linux发行版如Ubuntu被广泛应用于科研领域,因为其稳定性和丰富的开源资源库。在此基础上,还需要设置驱动程序以确保所购买的GPU能正常工作;接着便是安装必要的依赖项,比如Python解释器及其开发包等基础组件。 为了简化后续操作流程,推荐预先准备好Docker镜像文件,这样可以在不同机器之间快速复制相同的实验环境而无需重复配置过程。此外,Anaconda也是一个不错的选择,通过创建虚拟环境的方式管理各个项目的特定版本要求,从而避免相互干扰。 #### 框架选择 目前市面上存在多种成熟的深度学习框架供开发者挑选使用,其中包括但不限于TensorFlow, PyTorch, Keras等等。这类工具箱提供了便捷易用的应用编程接口(API),使得研究人员能够更加专注于算法的设计而非底层实现细节上。具体应该依据个人偏好和技术栈熟悉程度来做决定[^1]。 ```bash # 安装 NVIDIA GPU 驱动 (以 Ubuntu为例) sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt-get update sudo ubuntu-driver autoinstall # 使用 conda 创建 Python 环境 并激活 conda create --name dl_env python=3.8 conda activate dl_env # 安装 pytorch 和其他常用库 pip install torch torchvision torchaudio ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值