CUDA、cuDNN、PyTorch:深度学习环境搭建秘籍
文章平均质量分 91
历经数百次配置调试,踩过无数坑,硬盘格式化都成 “家常便饭”,终得 CUDA、cuDNN、PyTorch 等深度学习工具配置与使用的独家心得。本专栏从环境搭建细节讲起,深入剖析安装、版本适配、性能优化,结合实战项目分享加速技巧,助你避开弯路,快速掌握深度学习开发核心能力。
AITechLab
全媒体运营师/百度智能云AIGC资深认证工程师/讯飞&Datawhale Prompt Engineer/阿里魔塔社区&Datawhale Agent Engineer/亚马逊云科技AIGC技术开发能力认证/亚马逊云科技AIGC商业应用能力认证/工信部AIGC技术应用能力-通用办公能力认证/工信部AIGC技术应用能力-美术设计能力认证/等
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Windows系统上无法安装nvidia-nccl-cu12的深度探索
Windows系统安装nvidia-nccl-cu12问题摘要 本文探讨了Windows系统无法安装nvidia-nccl-cu12的根本原因。问题主要源于: PyPI上的nvidia-nccl-cu12仅为占位项目,实际包托管在NVIDIA Python Package Index 当前仅提供Linux平台的whl文件(manylinux_x86_64和aarch64) Windows平台标签(win_amd64)与现有包不兼容 解决方案尝试: 先安装nvidia-pyindex 检查平台标签兼容性 确认原创 2025-11-28 17:51:46 · 954 阅读 · 1 评论 -
Windows 系统 Python 虚拟环境中安装 CUDA 相关包的完整指南 cutensor-cu12 /tensorrt-cu12-libs /nvidia-cudnn-cu12
本文提供了Windows系统Python虚拟环境中安装CUDA相关包的完整指南。针对cutensor-cu12、tensorrt-cu12-libs和nvidia-cudnn-cu12三个核心包,详细介绍了预编译.whl文件的下载方法、安装步骤和验证流程。文章重点解决常见安装问题,包括版本匹配、依赖项缺失和CUDA兼容性等,并对比了直接pip安装、使用镜像源和源码编译等失败方案。通过本地安装预编译包的方法,确保在Python虚拟环境中实现稳定可靠的CUDA加速环境搭建,为科学计算和深度学习项目提供GPU加速原创 2025-11-26 08:15:00 · 1279 阅读 · 0 评论 -
ComfyUI安装NVIDIA Apex [CUDA扩展支持] 完全指南:从报错‘Nvidia APEX normalization not installed’到完美解决
本文详细介绍了在ComfyUI中安装NVIDIA Apex库以支持CUDA扩展的完整过程。从最初遇到的"Nvidia APEX normalization not installed"错误开始,作者尝试了多种解决方案:直接pip安装、源码编译、带CUDA扩展的编译等,但都未能完全解决问题。最终通过修改setup.py文件,注释掉CUDA版本检查代码,成功完成了安装。文章提供了详细的步骤说明和关键代码修改,帮助读者彻底解决这一常见安装问题,使ComfyUI能够充分利用Apex的性能优化功能原创 2025-11-23 22:26:55 · 1045 阅读 · 0 评论 -
Intel oneAPI Deep Neural Network Library (oneDNN) 完整指南
Intel oneDNN是面向深度学习的跨平台性能优化库,提供卷积、矩阵乘法等核心操作的硬件加速。该指南介绍了oneDNN 2025.3版本的新特性,包括CPU/GPU优化、自动调优功能和丰富的原语集合。文章详细讲解了安装配置、快速入门示例以及性能优化策略,如数据类型选择、内存格式优化和操作融合等。此外还展示了在计算机视觉、NLP等场景的应用案例,以及如何与TensorFlow、PyTorch等框架集成。oneDNN通过统一的API实现跨架构支持,帮助开发者在Intel处理器上获得最佳性能表现。原创 2025-11-12 11:35:58 · 1184 阅读 · 0 评论 -
【笔记】xFormers版本与PyTorch、CUDA对应关系及正确安装方法详解
xFormers作为Meta开发的Transformer优化库,在安装过程中常因版本不匹配导致问题。本文详细分析了xFormers与PyTorch、CUDA的版本对应关系,并提供了三种正确安装方法:1) 使用特定index-url安装(推荐);2) 从源码安装;3) 指定版本安装。安装后可通过检查版本号、xFormers配置和CUDA支持进行验证。正确匹配版本能避免PyTorch被降级为CPU-only版本的问题,确保xFormers发挥最佳性能。原创 2025-11-11 13:23:46 · 2541 阅读 · 0 评论 -
【笔记】解决 “AssertionError: Torch not compiled with CUDA enabled“ 错误
解决PyTorch的CUDA错误"AssertionError: Torch not compiled with CUDA enabled"指南:该错误通常由PyTorch未启用CUDA支持或版本冲突导致。解决方法包括:1.检查当前PyTorch版本;2.从官网获取正确安装命令(含torchvision和torchaudio);3.强制重装指定版本;4.验证安装结果。其他方案包括完全重装、使用PEP517参数等。预防措施建议使用虚拟环境并注意版本兼容性。最终通过正确安装CUDA支持的Py原创 2025-11-05 11:03:12 · 3491 阅读 · 1 评论 -
基于 EPGF 架构理念的 FaceFusion 3.4.1 本地 .venv 部署教程(非 Conda 环境部署优化版)
本文介绍基于EPGF架构理念的FaceFusion本地部署方案。EPGF是工程化Python治理体系,通过多级隔离实现环境可控。教程详细说明在Windows下使用.venv虚拟环境部署FaceFusion的步骤:1)克隆仓库;2)切换Python3.12环境;3)创建虚拟环境;4)升级基础工具;5)安装PyTorch GPU版;6)可选安装TensorRT;7)安装CUDA版ONNXRuntime;8)启动程序。重点实现版本隔离、依赖隔离和工具链隔离,确保环境纯净且可复现。最后提供部署验证方法和常见问题解决原创 2025-09-15 20:39:43 · 2067 阅读 · 0 评论 -
【笔记】Windows 安装 TensorRT 10.13.3.9(适配 CUDA 13.0,附跨版本 CUDA 调用维护方案)
本文详细介绍了在Windows系统下安装TensorRT 10.13.3.9(适配CUDA 13.0)的全流程指南。主要内容包括:1)前期准备,确认CUDA、cuDNN等依赖版本;2)解压安装包并配置系统环境变量;3)安装Python接口;4)通过Python和C++两种方式验证安装;5)常见问题解决方案。特别提供了跨CUDA版本调用维护实例(系统CUDA13.0与虚拟环境CUDA12.8差异场景),包含FaceFusion项目的TensorRT加速配置方法。文章配有详细操作截图和错误排查指南,帮助开发者顺原创 2025-09-13 21:46:07 · 2909 阅读 · 0 评论 -
【实战演练】Anaconda 极简路径治理保姆级教程:从卸载清理到 D:\A 安装部署
本文提供了Anaconda极简路径治理的全流程指南,重点介绍将Anaconda安装到D:\A路径的方案。主要内容包括:1)彻底卸载旧版本的详细步骤;2)将新版本精准安装到D:\A路径的方法;3)验证安装及配置国内镜像源;4)在D:\A\envs路径下创建多版本Python虚拟环境;5)工具链本地化实现项目级环境自治。该方案通过字符最短化、路径统一化的设计,解决了传统安装路径冗长、管理混乱的问题,便于多机部署和迁移。文中包含卸载清理、安装配置、环境创建等各环节的具体操作命令和截图说明,同时强调工具链本地化对项原创 2025-09-08 00:25:27 · 812 阅读 · 0 评论 -
【笔记】总结记录:WSL 发行版从 C 盘迁移到 D 盘的完整实操方法
1. 问题场景WSL(适用于 Linux 的 Windows 子系统)默认将发行版(如 Ubuntu)存储在 C 盘 AppData\Local\Packages 目录下,长期使用易导致 C 盘空间不足,影响系统性能。2. 迁移目标将已安装的 WSL 发行版(如 Ubuntu、Ubuntu-Preview)从 C 盘迁移到 D 盘指定目录(如 D:\wsl),后续 WSL 数据直接存储在 D 盘,避免 C 盘占用。原创 2025-09-07 04:49:59 · 3446 阅读 · 0 评论 -
【保姆级教程】阿里 Wan2.1-T2V-14B 模型本地部署全流程:从环境配置到视频生成(附避坑指南)
本文是阿里 Wan2.1-T2V-14B 模型的本地部署全流程指南。涵盖从克隆仓库、创建虚拟环境、调整依赖配置,到安装 PyTorch、项目依赖及 flash-attn 的步骤。详细说明通过 Hugging Face 和 ModelScope 下载模型的方法,包括解决 Xet Storage 存储的性能优化依赖。还介绍了运行测试命令及参数调整建议,同时提及模型支持消费级 GPU、多任务处理等特性,以及集成到 Diffusers 和 ComfyUI 的相关信息,助力用户顺利完成模型部署与使用。原创 2025-09-03 11:56:22 · 2737 阅读 · 3 评论 -
【2025 更新版】Windows 平台从零部署 SkyReels-V2 视频生成项目:踩坑修复与稳定运行指南
本文详细记录了在Windows平台部署SkyReels-V2视频生成项目的完整过程。针对官方仅支持Linux环境的情况,作者通过多次尝试和版本适配,最终找到稳定运行方案。关键步骤包括:1)环境检查(显卡驱动、CUDA版本);2)创建Python3.11虚拟环境;3)安装特定版本PyTorch(2.7.0)和适配Windows的依赖库;4)配置模型缓存路径;5)编写测试脚本并优化参数。文中重点解决了Triton编译、flash_attn安装等Windows特有兼容性问题,提供了显存优化建议和常见报错解决方案,原创 2025-09-02 02:00:42 · 1446 阅读 · 0 评论 -
在 WSL2-NVIDIA-Workbench 中安装Anaconda、CUDA 13.0、cuDNN 9.12 及 PyTorch(含完整环境验证)
在 WSL-NVIDIA-Workbench(NVIDIA AI Workbench & Ubuntu 22.04)中原创 2025-08-30 22:20:11 · 1541 阅读 · 0 评论 -
在WSL2-Ubuntu中安装Anaconda、CUDA13.0、cuDNN9.12及PyTorch(含完整环境验证)
因需安装依赖本地CUDA编译的软件包,需完整部署CUDA Toolkit、cuDNN及PyTorch环境。从CUDA12.9版本起,NVIDIA支持通过Anaconda安装cuDNN,故调整流程为先装Anaconda(前置)→再装CUDA13.0→接着装cuDNN9.12→最后装PyTorch,确保版本适配且操作高效,关键步骤附官方及实操参考链接,保障可复现性。原创 2025-08-24 13:41:01 · 4367 阅读 · 0 评论 -
安装 CUDA 13 后 ONNX Runtime 报错“Failed to create CUDAExecutionProvider” 的完整修复方案——附 CMD & PowerShell 一
这个报错说明你的 ONNX Runtime(ORT)在尝试加载 CUDA 加速时失败了,主要原因是 缺少 CUDA 12.x 和 cuDNN 9.x 的运行环境,或者相关依赖没有被正确识别。原创 2025-08-21 21:21:13 · 1673 阅读 · 0 评论 -
CUDA 13.0 适配的 cuDNN 9.11 发布:网页内容速览
cuDNN 作为基于 CUDA 的深度学习加速库,在 CUDA 13.0 更新后,其 9.11 版本也已发布,官方网页对该版本有详细介绍。原创 2025-08-05 13:07:41 · 5246 阅读 · 1 评论 -
NVIDIA CUDA 13.0 发布:新特性与快捷更新安装全解析
NVIDIA CUDA 13.0 发布:新特性与快捷更新安装全解析原创 2025-08-05 12:36:19 · 5223 阅读 · 3 评论 -
记录 Windows11安装支持CUDA12.3的Pytorch版本,验证PyTorch是否安装成功
Windows11安装支持CUDA12.3的Pytorch版本,验证PyTorch是否安装成功原创 2023-12-06 19:41:15 · 25874 阅读 · 34 评论 -
好消息,最新CUDA和cuDNN安装,俩都可以用exe安装包直装了 CUDA12.6.3和cuDNN9.6.0 Windows系统 省事
好消息,最新CUDA和cuDNN安装,可以用安装包直装了!CUDA12.6和cuDNN9.6.0 Windows系统原创 2024-12-09 23:07:48 · 4230 阅读 · 1 评论 -
【笔记】NVIDIA AI Workbench 中安装 CUDA 12.9
1、 nvcc -V 正确显示版本号。2、 nvidia-smi 无报错。3、 环境变量已写入 .bashrc,并通过 source 生效。。原创 2025-06-11 16:14:31 · 2242 阅读 · 0 评论 -
记录conda环境升级CUDA相关包后,打开环境终端大段输出或报错
记录工作直接在stable diffusion webui的conda环境升级CUDA版本后,再打conda虚拟环境后,出现大段报错和输出。原创 2024-03-06 11:28:05 · 2139 阅读 · 0 评论 -
【笔记】FaceFusion 3.3.0 CUDA GPU 环境 Docker 构建与运行全流程记录
FaceFusion 3.3.0 使用 Docker 本地部署 (CUDA GPU支持) 操作记录(基于克隆仓库的原始流程)原创 2025-06-26 10:19:34 · 2510 阅读 · 1 评论 -
太方便,WIN系统CUDA12.4下使用conda便捷管理虚拟环境中的不同版本的CUDA、cuDNN、PyTorch
记录工作实践。原创 2024-03-03 00:03:05 · 26510 阅读 · 15 评论 -
修复笔记:SkyReels-V2 项目中的 torch.cuda.amp.autocast 警告和错误
工作记录。原创 2025-05-05 00:02:59 · 1014 阅读 · 0 评论 -
在 Windows 11 下的 WSL - Ubuntu 24.04 中安装 CUDA 的记录
记录工作。原创 2024-12-26 10:42:27 · 1516 阅读 · 0 评论 -
【CUDA GPU 支持安装全攻略】PyTorch 深度学习开发者指南
🚀【CUDA GPU 支持安装全攻略】PyTorch 深度学习开发者指南面向对象:初学者、研究人员、生产部署人员适用平台:Windows / Linux / WSL / 容器环境等全平台支持原创 2025-06-15 11:28:52 · 1625 阅读 · 0 评论 -
PyTorch 的 CUDA GPU 支持 · 安装五条铁律(最新版 2025 修订)(适用于所有用户)
yTorch 的 CUDA GPU 支持 · 安装五条铁律(最新版 2025 修订)(适用于所有用户)总结一句话:PyTorch GPU 安装,不靠猜:驱动决定上限,命令来自官网,三件套版本对齐装,联网顺利下载全,验证支持才算完。原创 2025-06-15 01:38:11 · 9089 阅读 · 0 评论 -
是否需要预先安装 CUDA Toolkit?——按使用场景分级推荐及进阶说明
只跑 PyTorch + CUDA 模型 → 不需要 CUDA 工具链想用 CUDA 写代码或编译插件 → 一定要装 CUDA 工具链使用目标是否推荐预装 CUDA Toolkit学习使用 PyTorch GPU❌ 不推荐,直接 pip/conda 安装即可开发 PyTorch 插件 / 自定义 CUDA 算子✅ 推荐,必须使用 CUDA 编译工具构建/部署生产环境✅ 强烈推荐,便于稳定运维和调试总之,预先安装能很大程度上避免全局中的项目开发因CUDA工具链不完善而受阻的情况发生。原创 2025-06-14 23:54:14 · 2700 阅读 · 0 评论 -
Windows 系统上的 WSL 实现方案 之 那些你可能忽略的“隐藏 WSL-Linux 选择”
你以为你只装了一个工具,实际上你获得了一个个独立的 Linux 开发空间。这些由第三方工具生成的 WSL 实例,是现代 Windows 开发者最容易忽视的“隐藏资源”。它们不仅帮你节省了手动安装发行版的时间,还带来了更多灵活性和选择空间。它们不只是工具,更是为你悄悄准备好的 Linux 环境工厂。原创 2025-06-12 08:33:27 · 1119 阅读 · 0 评论 -
【笔记】NVIDIA AI Workbench 中安装 PyTorch
(部分整理,未完整罗列)原创 2025-06-11 18:50:25 · 1315 阅读 · 0 评论 -
【笔记】NVIDIA AI Workbench 中安装 cuDNN 9.10.2
总结。原创 2025-06-11 18:07:26 · 1739 阅读 · 0 评论 -
CUDA 与 cuDNN 免登录下载政策详解(基于官方权威信息)
NVIDIA 已从2023 年开始逐步开放 CUDA 和 cuDNN 的免登录下载功能CUDA 12.1+:官网直接下载,无需登录:可通过构造直链绕过登录流程下载旧版本(CUDA 11.x、cuDNN 8.7.0 及以下):官方仍需登录,但可通过直链或第三方渠道绕过建议开发者优先使用免登录新版本,提升开发效率并确保安全性。原创 2025-06-11 17:18:59 · 2048 阅读 · 0 评论 -
升级 CUDA Toolkit 12.9 与 cuDNN 9.9.0 后验证指南:功能与虚拟环境检测
在深度学习领域,CUDA、cuDNN 和 torch 之间具备向下兼容特性。这得益于它们的自动适配安装机制,会依据当前环境以及已有库状况,安装最合适版本,所以开发者无需因验证版本号与安装版本号不一致而忧心。目前,torch 官方尚未发布支持 CUDA 12.9 的版本。当在 Windows 主系统完成 CUDA Toolkit 12.9 与 cuDNN 9.9.0 升级后,若未在 conda、virtualenv 等虚拟环境中另行安装适配新版本的库,验证时会呈现虚拟环境中原先的版本信息。原创 2025-05-05 00:02:25 · 5849 阅读 · 0 评论 -
新系统安装CUDA12.8卡在installing Nsight visual studio edtion界面不动的解决方案
情景回顾:安装新系统后,下载安装最新Visual Studio 2022后开始安装CUDA12.8,结果一直卡在CUDA程序的这个界面,尝试了各种办法,重启无数次,最后无奈只有尝试了降级Visual Studio 2022版本号才得以继续。只有降级Visual Studio 2022的版本号到17.13以下,才能正常安装,这是因为官方已经发现17.3版本和CUDA12.8确实存在冲突问题。降级到17.9后安装正常,注意,需要卸载新的版本后重启电脑,然后再安装特定的版本(版本号<17.13)。原创 2025-02-27 11:59:07 · 1648 阅读 · 0 评论 -
CUDA Toolkit 12.9 与 cuDNN 9.9.0 发布,带来全新特性与优化
NVIDIA 近日发布了 CUDA Toolkit 12.9,为开发者提供了一系列新功能和改进,旨在进一步提升 GPU 加速应用的性能和开发效率。CUDA Toolkit 是创建高性能 GPU 加速应用的关键开发环境,广泛应用于从嵌入式系统到超级计算机的各种计算平台。原创 2025-05-04 11:29:02 · 3629 阅读 · 0 评论 -
“100% 成功的 PyTorch CUDA GPU 支持” 安装攻略
通过严格按照上述步骤操作,特别是使用 PyTorch 官方网站生成的安装命令,我们能够确保torch和torchaudio三个包的版本兼容性,从而 100% 成功安装带有 CUDA 12.8 GPU 支持的 PyTorch。在安装过程中,要仔细检查每个步骤,根据不同的项目需求准确判断并配置安装选项,确保满足先决条件。同时,优先选择pip或conda从官方网站获取命令进行安装,避免使用不推荐的本地安装方式。希望这份攻略能够帮助我们顺利搭建起高效的深度学习开发环境。原创 2025-04-30 18:52:29 · 4090 阅读 · 0 评论 -
UniGetUI 使用指南:轻松管理 Windows 软件(包括CUDA)
UniGetUI(前身为 WingetUI)是一款专门为 Windows 10(x64)和 Windows 11 系统打造的图形化包管理器界面工具。它集成了 Winget、Scoop、Chocolatey、Npm、Pip、Cargo、vcpkg、.NET Tool 和 PowerShell 等多种常用包管理器的功能,为用户提供了便捷的软件管理体验,无需记忆复杂的命令参数,即可轻松完成软件的搜索、安装、更新和卸载等操作。以下是详细的下载与使用教程。原创 2025-05-05 16:38:05 · 3314 阅读 · 2 评论 -
验证PyTorch深度学习环境Torch和CUDA还有cuDNN是否正确配置的命令
工作记录python以进入python环境,如果是虚拟环境则需要先激活要验证的虚拟环境。这段 Python 脚本主要用于检查 PyTorch 深度学习环境的配置信息,并进行简单的张量运算,下面为详细解释它们的具体作用。原创 2025-03-13 12:25:09 · 2439 阅读 · 0 评论 -
在WSL2-Ubuntu中安装CUDA12.8、cuDNN、Anaconda、Pytorch并验证安装
记录工作提示:整个过程最好先开启系统代理,也可以用镜像源,确保有官方发布的最新特性和官方库的完整和兼容性支持。期间下载会特别慢,需要在系统上先开启代理,然后WSL设置里打开网络模式“Mirrored”,以设置WSL自动使用主机上的代理网络。【WLS2怎么设置网络自动代理 - 优快云 App】https://blog.youkuaiyun.com/u014451778/article/details/146073726?原创 2025-03-07 11:13:04 · 13933 阅读 · 20 评论 -
新!在 podman-machine-default 中安装 CUDA、cuDNN、Anaconda、PyTorch 等并验证安装
在 Windows 系统开发环境中,Podman Desktop 凭借强大的容器管理与 WSL-Linux 子系统集成能力备受开发者关注。其中,podman-machine-default 是 Podman Desktop 安装后自带的默认 WSL-Fedora 子系统,支持与显卡通信,可用于搭建深度学习环境及部署 AI 项目。解锁新技能!Windows 11 借助 WSL - Linux 部署 GitHub 项目全攻略_wsl github-优快云博客。原创 2025-04-25 23:57:12 · 2219 阅读 · 0 评论
分享