ubuntu 20.04安装NVIDIA 4060驱动,安装cuda和cudnn,以及nvidia container toolkit、TensorRT

拿着带显卡的4060笔记本,发现跑一个基本的rviz显示都够呛,原因是4060没安装驱动成为一个废铁,记录安装过程:20.04的系统,加上4060的版本,直接在nvidia的官网进行搜索取得下载

sudo ubuntu-drivers devices //无用的命令,找了也不行

1. 安装驱动:

官方驱动地址:Drivers

2. 安装cuda:

RTX 40 系列需要 CUDA 11.8 或更高版本。我安装12.0

CUDA Toolkit Archive | NVIDIA Developer(下载如口)

驱动地址:CUDA Toolkit 12.0 Update 1 Downloads | NVIDIA Developer(12.0版本)

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.0.1/local_installers/cuda-repo-ubuntu2004-12-0-local_12.0.1-525.85.12-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-0-local_12.0.1-525.85.12-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-0-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda

配置环境变量如下:

# 更新默认 CUDA 软链接
sudo rm -f /usr/local/cuda
sudo ln -s /usr/local/cuda-12.0 /usr/local/cuda

# 更新环境变量(添加到 ~/.bashrc)
echo 'export CUDA_HOME=/usr/local/cuda-12.0' >> ~/.bashrc
echo 'export PATH=$CUDA_HOME/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc


nvcc --version
nvidia-smi
nvcc -V  #查看CUDA版本

更简洁的办法:

source /etc/lsb-release
UBUNTU_VERSION=ubuntu${DISTRIB_RELEASE/./}

wget https://developer.download.nvidia.com/compute/cuda/repos/${UBUNTU_VERSION}/x86_64/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb

sudo apt-get update

sudo apt-get -y install cuda-11-8

sudo reboot

3. 安装cudnn

下载地址:cuDNN Archive | NVIDIA Developer

sudo dpkg -i cudnn-local-repo-ubuntu2004-8.9.7.29_1.0-1_amd64.deb

这个操作不会直接安装 cuDNN,而是会在您的系统中创建一个本地的 APT 仓库,其中包含了 cuDNN 8.9.7.29 的安装包。

sudo cp /var/cudnn-local-repo-ubuntu2004-8.9.7.29/cudnn-*-keyring.gpg /usr/share/keyrings/

为了让 APT 信任这个本地仓库中的软件包,需要导入 NVIDIA 的 GPG 密钥

sudo apt-get update

更新 APT,让它识别新添加的本地仓库

sudo apt-get install -y libcudnn8=8.9.7.29-1+cuda12.2 libcudnn8-dev=8.9.7.29-1+cuda12.2

现在可以从本地仓库安装特定版本的 cuDNN 了

# 检查 cuDNN 版本
cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

4. 安装nvidia container toolkit :

Installing the NVIDIA Container Toolkit — NVIDIA Container Toolkit

sudo nvidia-ctk runtime configure --runtime=docker
docker pull nvidia/cuda:12.0.0-cudnn8-devel-ubuntu20.04

docker run --rm --gpus all nvidia/cuda:12.0.0-cudnn8-devel-ubuntu20.04 nvidia-smi

5. 安装TensorRT

软件源安装:

# 安装依赖工具
sudo apt-get update
sudo apt-get install -y wget

# 添加NVIDIA GPG密钥
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/3bf863cc.pub
sudo mv 3bf863cc.pub /etc/apt/trusted.gpg.d/cuda.asc

# 添加CUDA和机器学习软件源
echo "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ /" | sudo tee /etc/apt/sources.list.d/cuda.list
echo "deb https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu2204/x86_64/ /" | sudo tee /etc/apt/sources.list.d/nvidia-ml.list

# 更新软件包列表
sudo apt-get update

# 现在搜索 TensorRT 包
apt-cache madison libnvinfer10
# 添加 NVIDIA 机器学习仓库的 GPG 密钥
wget -qO - https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu2004/x86_64/7fa2af80.pub | sudo apt-key add -

# 或者使用更现代的方法
wget -qO - https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu2004/x86_64/7fa2af80.pub | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-ml-keyring.gpg

# 更新软件源
sudo apt update

安装固定版本的cudnn:

sudo apt-get install -y \
    libnvinfer10=10.8.0.43-1+cuda12.8 \
    libnvinfer-plugin10=10.8.0.43-1+cuda12.8 \
    libnvonnxparsers10=10.8.0.43-1+cuda12.8 \
    libnvinfer-dev=10.8.0.43-1+cuda12.8 \
    libnvinfer-plugin-dev=10.8.0.43-1+cuda12.8 \
    libnvinfer-headers-dev=10.8.0.43-1+cuda12.8 \
    libnvinfer-headers-plugin-dev=10.8.0.43-1+cuda12.8 \
    libnvonnxparsers-dev=10.8.0.43-1+cuda12.8
dpkg -l | grep -i cuda
dpkg -l | grep -i cudnn
dpkg -l | grep -i tensorrt

锁定cudnn和tensorrt版本:

sudo apt-mark hold \
libcudnn8 \
libnvinfer10 \
libnvinfer-plugin10 \
libnvonnxparsers10 \
libcudnn8-dev \
libnvinfer-dev \
libnvinfer-plugin-dev \
libnvonnxparsers-dev \
libnvinfer-headers-dev \
libnvinfer-headers-plugin-dev

卸载tensorrt:

# 卸载所有TensorRT相关包
sudo apt-get remove --purge \
    libnvinfer10 \
    libnvinfer-plugin10 \
    libnvonnxparsers10 \
    libnvinfer-dev \
    libnvinfer-plugin-dev \
    libnvinfer-headers-dev \
    libnvinfer-headers-plugin-dev \
    libnvonnxparsers-dev

# 清理残留文件
sudo apt-get autoremove

安装指定版本

sudo apt-get install -y \
    libnvinfer10=10.9.0.34-1+cuda12.8 \
    libnvinfer-plugin10=10.9.0.34-1+cuda12.8 \
    libnvonnxparsers10=10.9.0.34-1+cuda12.8 \
    libnvinfer-dev=10.9.0.34-1+cuda12.8 \
    libnvinfer-plugin-dev=10.9.0.34-1+cuda12.8 \
    libnvinfer-headers-dev=10.9.0.34-1+cuda12.8 \
    libnvinfer-headers-plugin-dev=10.9.0.34-1+cuda12.8 \
    libnvonnxparsers-dev=10.9.0.34-1+cuda12.8

查看安装版本:

dpkg -l | grep nvinfer

### 安装 NVIDIA Container Toolkit 的指南 在 Ubuntu 20.04安装 NVIDIA Container Toolkit 可以通过多种方式实现,包括在线安装离线安装。以下是详细的安装步骤: #### 在线安装方法 1. **设置 APT 包管理器以使用 NVIDIA 的存储库** 首先需要配置系统以使用 NVIDIA 提供的 APT 存储库。运行以下命令来导入 NVIDIA Docker GPG 密钥并添加存储库: ```bash distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list ``` 然后更新 APT 缓存: ```bash sudo apt-get update ``` 2. **安装 NVIDIA Container Toolkit** 使用以下命令安装 NVIDIA Container Toolkit 及其依赖项: ```bash sudo apt-get install -y nvidia-container-toolkit ``` 3. **配置 Docker 使用 NVIDIA Runtime** 安装完成后,需要配置 Docker 以使用 NVIDIA 提供的 GPU 运行时。运行以下命令完成配置: ```bash sudo nvidia-ctk runtime configure --runtime=docker ``` 然后重启 Docker 服务以使更改生效: ```bash sudo systemctl restart docker ``` 4. **验证安装** 最后,可以通过运行一个支持 GPU 的容器来验证安装是否成功: ```bash sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi ``` 如果一切正常,应该可以看到 GPU 的相关信息[^2]。 #### 离线安装方法 如果系统无法访问互联网,可以采用离线安装的方式。以下是具体步骤: 1. **下载必要的安装包** 访问 [NVIDIA Container Toolkit Releases](https://github.com/NVIDIA/nvidia-container-toolkit/releases) 页面,下载以下四个安装包: - `nvidia-container-toolkit-base_<version>_amd64.deb` - `libnvidia-container1_<version>_amd64.deb` - `libnvidia-container-tools_<version>_amd64.deb` - `nvidia-container-toolkit_<version>_amd64.deb` 或者从其他可信来源(如引用中提到的 优快云 链接)下载这些文件[^4]。 2. **安装依赖工具包** 将下载的 `.deb` 文件上传到目标机器,并按照正确的顺序进行安装: ```bash sudo dpkg -i libnvidia-container1_<version>_amd64.deb sudo dpkg -i libnvidia-container-tools_<version>_amd64.deb sudo dpkg -i nvidia-container-toolkit-base_<version>_amd64.deb sudo dpkg -i nvidia-container-toolkit_<version>_amd64.deb ``` 3. **配置 Docker 使用 NVIDIA Runtime** 安装完成后,运行以下命令配置 Docker 使用 NVIDIA Runtime: ```bash sudo nvidia-ctk runtime configure --runtime=docker ``` 然后重启 Docker 服务: ```bash sudo systemctl restart docker ``` 4. **验证安装** 使用以下命令验证安装是否成功: ```bash sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi ``` 如果显示 GPU 信息,则说明安装成功[^3]。 --- ### 注意事项 - 确保系统已正确安装 Docker 并运行正常。 - 如果在安装过程中遇到问题,可以检查系统的内核版本是否兼容,或者参考 NVIDIA 官方文档获取更多帮助[^1]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值