前言
CUDA(Compute Unified Device Architecture) 是由NVIDIA开发的并行计算平台和编程模型。它利用了NVIDIA的GPU(图形处理器)来加速计算任务,使得许多复杂的计算任务可以在GPU上并行处理,从而提高计算性能。
CUDA最初是为了加速图形渲染而开发的,但随着时间的推移,它逐渐演变成一种通用的并行计算平台。CUDA允许开发人员使用普通的C或C++编程语言编写并行计算程序,并利用GPU的并行计算能力来加速执行。这使得开发人员能够利用GPU强大的计算能力来处理各种类型的任务,包括科学计算、机器学习、深度学习、数据分析等。
本教程将在 Windows 11 环境下正确安装 Nvidia 驱动、CUDA 和 cuDNN,快速搭建稳定的深度学习开发环境!
一、安装 Nvidia 驱动
1. 确认显卡型号
右击 开始菜单,打开 设备管理器,展开 显示适配器,查看 Nvidia 显卡型号。如图我的笔记本电脑显示 NVIDIA GeForce RTX 4050 Laptop GPU:
2. 下载最新驱动
访问 Nvidia官网,下滑找到 Manual Driver Search板块,根据刚才从设备管理器查到的本机显卡型号以及操作系统版本等信息查找 最新的 Game Ready 或 Studio 驱动 并下载。
- (选择该项) Game Ready 驱动:主要面向游戏玩家。它经过了专门的优化和测试,旨在为各种主流游戏提供最佳的性能表现和稳定性,确保玩家在运行游戏时能够获得流畅的帧率、高质量的画面效果以及最少的卡顿和故障。
- Studio 驱动:是为专业创意工作者设计的,比如从事视频编辑、3D 建模、动画设计、图形设计等工作的人员。这些驱动针对专业软件进行了深度优化,以满足专业用户在创作过程中对图形处理的高要求。
3. 安装驱动
3.1 运行下载的 .exe 文件,点击同意并继续

3.2 选择安装方法(推荐自定义安装)
- 精简安装:该方式主要用于对现有驱动程序进行更新,同时保留当前已设置好的 NVIDIA 各项参数与配置。
- 自定义安装:当您的计算机上尚未安装任何 NVIDIA 驱动程序,或者您希望对驱动安装组件进行精细选择,如选择特定版本的组件、安装路径等,就可以选择此安装方式。
- 选择 自定义安装 后勾选执行清洁安装:清洁安装会将所有 NVIDIA 设置恢复为默认值并删除它已创注的所有配置文件。
3.3 验证 NVIDIA 驱动
安装完成后,重启电脑,然后打开 命令提示符 (cmd) 或 PowerShell,输入以下命令检查驱动是否正常工作:
nvidia-smi
如果安装成功,你应该会看到类似下面的输出:(记住这里的 CUDA Vesrion,下面操作会用到)
二、安装 CUDA Toolkit
1. 查看历史版本
打开 CUDA Toolkit 历史版本,从中挑选版本号 小于或等于本机 CUDA Version 的 CUDA Toolkit 进行安装。
2. 下载 CUDA Toolkit
选择 Windows -> x86_64 -> Windows 11 -> 安装方式(如exe本地安装)
下载并运行 .exe 文件

3. 安装 CUDA Toolkit
- 运行下载的安装程序,可选择 精简安装 或 自定义安装(推荐)
- 若选择 自定义安装,在安装过程中,可按默认选项安装组件,包括 CUDA 开发工具、运行时库、驱动程序 等。
- 如果在安装过程中出现类似下图的提示,这表明安装程序未能在本地检测到已安装的Visual Studio。你需要先前往Visual Studio 官方网站下载并安装Visual Studio。
4. 检查 CUDA 安装
打开 命令提示符(CMD)或 PowerShell。
输入以下命令来检查 CUDA 版本:
nvcc --version
如果 CUDA 安装正确,命令行将显示 CUDA 的版本信息。例如:
三、安装 cuDNN
1. 下载 cuDNN
访问 Nvidia cuDNN 下载页面,需要注册 Nvidia 开发者账号后才能下载(自行注册,推荐谷歌登录)。根据之前安装的CUDA版本,展开相应的cuDNN目录,然后点击下载对应系统的压缩包。
注意:cuDNN对CUDA的适配未必能够向下兼容,所以请尽量安装与CUDA版本完全一致的cuDNN。点击 Local Installer for Windows (Zip) 即可下载cuDNN压缩包。
2. 解压并配置 cuDNN
2.1 解压文件
下载完成后,解压 .zip 文件,解压后的文件如下:
2.2 配置 cuDNN
将解压后的文件夹中的bin、include、lib 三个文件夹,移动到到 CUDA Toolkit 安装目录,与同名文件夹合并,例如:(确保覆盖 bin、lib 和 include 目录中的文件)
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6
四、检查环境变量
步骤一:检查并配置 CUDA 环境变量
打开系统环境变量设置窗口
在 Windows 中,右键点击“此电脑”或“计算机”图标,选择 “属性”,然后点击 “高级系统设置”。
在弹出的 “系统属性” 窗口中,点击 “环境变量” 按钮。
检查并添加 CUDA 环境变量
在 “环境变量” 窗口中,找到 “系统变量” 区域,检查是否已存在以下两个变量:
- CUDA_PATH:此变量应指向您的 CUDA 开发工具包的安装路径(例如:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6)。
- CUDA_PATH_V12_6:此变量应指向 CUDA 12.6 版本的安装路径(例如:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6)。
如果上述变量不存在,请手动添加:
- 点击 “新建”,在 变量名 中输入 CUDA_PATH,在 变量值 中输入 CUDA 开发工具包的安装路径(例如:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6)。
- 同理,创建 CUDA_PATH_V12_6 变量,指向同样的安装路径。
步骤二:检查并添加 CUDA 到 Path 环境变量
- 在 “系统变量” 区域中,找到并双击 Path 变量,进入编辑界面。
- 检查并确认路径是否包含以下内容:
- CUDA 的 bin 文件夹路径:该路径应指向 bin 文件夹,通常为:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\bin
- CUDA 的 libnvvp 文件夹路径:该路径应指向 libnvvp 文件夹,通常为:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\libnvvp
如果缺少以上两项路径,请手动添加:
- 在 “编辑环境变量” 窗口中,点击 “新建”,输入 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\bin。
- 同样添加 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\libnvvp。
五、Python环境及运行库安装
1、安装python环境,前提是已经安装了anacoda软件:
conda create -n llm_learn python=3.10
2、再装计算框架库,这里以pytorch为例,进入PYTOCH页
注意选择自已cuda版本的python库
# ROCM 6.1 (Linux only)
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/rocm6.1
# ROCM 6.2 (Linux only)
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/rocm6.2
# CUDA 11.8
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu118
# CUDA 12.1
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121
# CUDA 12.4
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124
# CPU only
pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cpu
六、结语
通过以上步骤,我们已经成功在 Windows 11 环境下安装了 NVIDIA 驱动、CUDA Toolkit 和 cuDNN,并确保所有相关环境变量配置正确。这些工具将为你提供强大的 GPU 加速能力,特别适用于深度学习、数据科学等需要高性能并行计算的任务。
如果机器配置不够,可以租凭算力平台:1、 AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL
下面是我所用的安装包截图: