深度学习框架入门:PyTorch、TensorFlow 与 CUDA 配置详解
本文为《GPT 工程实战系列》第二篇,主要介绍 PyTorch 和 TensorFlow 的基础功能、CUDA 的 GPU 加速机制、以及本地环境配置与常见 IDE 问题解决方案,适合初学者与 AI 工程转型者阅读。
📌 一、PyTorch 与 TensorFlow 是什么?
✅ 共同点:
- 都是深度学习框架(Deep Learning Framework)
- 都可用于训练神经网络(如 GPT、BERT、自动驾驶模型、AlphaFold)
- 也支持部分传统机器学习算法(如逻辑回归、决策树、随机森林)
🚫 不推荐用途:
- 如果只做传统机器学习任务,推荐使用
scikit-learn更轻量。
📌 二、深度学习核心依赖:CUDA 与 GPU 加速
🚀 什么是 CUDA?
- CUDA(Compute Unified Device Architecture)是 NVIDIA 开发的 GPU 并行计算平台。
- 允许深度学习框架调用显卡资源,加速训练与推理过程。
✅ 深度学习中 GPU 加速的用途:
- 矩阵运算(如 Attention)
- 梯度反向传播计算
- 数十亿参数优化(如 GPT 大模型)
🧩 常见安装步骤:
- 安装 NVIDIA 显卡驱动
- 安装 CUDA Toolkit(建议按 PyTorch 官网推荐版本)
- 安装 cuDNN(深度学习优化库)
📌 三、PyTorch 安装与测试
🛠 安装指令(CUDA 11.8 示例):
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
✅ GPU 检测代码:
import torch
print("CUDA 是否可用:", torch.cuda.is_available())
print("GPU:", torch.cuda.get_device_name(0))
📌 四、常见环境工具介绍
✅ Anaconda
- 独立的 Python 发行版,便于管理依赖。
- 可使用
conda create --name pytorch_env python=3.9创建虚拟环境。
✅ 虚拟环境管理命令:
conda activate pytorch_env # 进入环境
conda deactivate # 退出环境
conda activate base # 回到默认环境
✅ PyCharm 问题排查:
- 出现 Broken Interpreter 时,建议:
- 卸载 PyCharm 并清理配置文件
- 删除
.venv后重建解释器路径
- PyCharm 默认使用项目内虚拟环境,如需重新安装 torch:
<venv路径>\python.exe -m pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
📌 五、nvcc 与 CUDA 路径问题
nvcc --version找不到时,说明系统 PATH 缺少 CUDA 编译器目录。- 添加路径即可(非必要):
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\libnvvp
⚠️ 注意:PyTorch 使用的是 CUDA 运行时(cuDNN/cuBLAS),不需要 nvcc 编译器即可运行 GPU 运算。
✅ 总结
本篇介绍了 PyTorch 与 TensorFlow 的基本用途及其与 GPU 的配合方式。后续我们将深入实战模型训练、部署与优化,敬请关注后续文章。
📌 YoanAILab 技术导航页
💡 项目源码 × 实战部署 × 转型经验,一页总览
👉 点击查看完整导航页
📚 包含内容:
- 🧠 GPT-2 项目源码(GitHub)
- ✍️ 优快云 技术专栏合集
- 💼 知乎转型日志
- 📖 公众号 YoanAILab 全文合集
3万+

被折叠的 条评论
为什么被折叠?



