ubuntu 22.04服务器版本cuda、Anaconda、pytorch环境配置以及安装llama_factory

全新服务器安装cuda、Anaconda以及配置llama_factory配置大模型

对于全新仅安装了nvidia驱动的服务器,版本为ubuntu 22.04, 且无图形化界面,详细配置流程如下。

1 硬件网络连接

首先遇到的问题是服务器连接上网线,但依旧不能访问网络,用ip addr查看发现4个端口的均为state down ,如下图,说明没有启用
在这里插入图片描述
作者硬件连接的网口名称为ens5f1,执行 sudo ip link set ens5f1 up即可启动

2 安装cuda

(1) 下载安装包

执行nvidia-smi查看cuda最高可安装版本为12.5
在这里插入图片描述
进入官网直接下载,为保证我们所需安装大多数软件的适配性,我们选择cuda 11.8安装,官网界面点进去选择:
在这里插入图片描述

按照自己系统的要求选择linux、x86_64、Ubuntu、22.04,以及安装类型选择runfile(local),便捷快速,即依次输入下方url

wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
sudo sh cuda_11.8.0_520.61.05_linux.run

在这里插入图片描述
在第2步安装程序中,出现该界面为同意条款,输入accept即可
在这里插入图片描述

对于具体安装内容,安装包内自带显卡驱动driver,但我们之前已经安装过了(nvidia-smi成功运行说明驱动成功安装),这里就不再重复安装,CUDA demo suite 和CUDA documentation 为示例和帮助文档文件,根据需要自行选择,作者选择不安装,注意通过空格进行取消选择,选择Install,然后就是漫长的等待
在这里插入图片描述

出现以下界面说明安装完成

### 在 Ubuntu 22.04安装 NVIDIA 驱动并配置 Anaconda 支持 GPU #### 安装 NVIDIA 显卡驱动 为了在 Ubuntu 22.04 上成功安装 NVIDIA 显卡驱动,可以按照以下方法操作: 1. **禁用 Nouveau 开源驱动程序** 默认情况下,Ubuntu 使用开源的 Nouveau 驱动程序。如果要切换到专有的 NVIDIA 驱动,则需要先禁用它。编辑文件 `/etc/modprobe.d/blacklist-nouveau.conf` 并添加以下内容[^2]: ```bash blacklist nouveau options nouveau modeset=0 ``` 2. **更新 initramfs 文件** 执行以下命令以应用更改: ```bash sudo update-initramfs -u ``` 3. **重启进入恢复模式** 重新启动计算机,在 GRUB 菜单中选择“Advanced Options”,然后选择带有“recovery mode”的选项。 4. **安装 NVIDIA 驱动** 在终端中运行以下命令来查找可用的 NVIDIA 驱动版本: ```bash ubuntu-drivers devices ``` 然后通过 `apt-get` 或者图形界面工具 Software & Updates 来安装推荐的驱动版本。例如: ```bash sudo apt install nvidia-driver-<version> ``` 替换 `<version>` 为你所需的驱动版本号。 5. **验证安装情况** 完成安装后,可以通过以下命令确认驱动已正确加载: ```bash nvidia-smi ``` --- #### 配置 Anaconda 支持 GPU 完成 NVIDIA 驱动安装之后,接下来需要设置 Anaconda 的 GPU 版本支持。 1. **下载并安装 Anaconda (GPU 版)** 访问官方页面或者参考 优快云 博客中的教程[^3],下载适合系统的 Anaconda 安装包(建议使用 Python 3.x)。执行如下命令进行安装: ```bash wget https://repo.anaconda.com/archive/Anaconda3-latest-Linux-x86_64.sh bash Anaconda3-latest-Linux-x86_64.sh ``` 2. **创建 Conda 环境并激活 CUDA 和 cuDNN** 创建一个新的 Conda 环境,并指定所需库的支持版本。例如,假设目标是 PyTorch-GPU 版本: ```bash conda create --name pytorch_env python=3.9 conda activate pytorch_env conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch ``` 3. **测试 GPU 是否正常工作** 在新环境中导入 PyTorch 库并检测是否有可用的 GPU 设备: ```python import torch print(torch.cuda.is_available()) # 如果返回 True 则表示成功启用 GPU print(torch.cuda.get_device_name(0)) # 输出当前使用的 GPU 名称 ``` --- #### 常见问题排查 - 若遇到黑屏现象,可能是由于驱动兼容性问题引起的;尝试卸载现有驱动再重试其他版本- 当无法识别显卡时,请确保 BIOS 设置允许 PCIe Gen4/GTX/Turing 架构等功能开启。 ---
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

空 白II

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值