NVIDIA GPU 的发展历史从架构、关键技术指标、应用产品三个维度的系统介绍,并附上清晰的对比表格,帮助你全面理解这家图形计算巨头的演进历程。
🧠 一、架构演进:从固定功能到 AI 加速
NVIDIA 的 GPU 架构经历了从图形渲染到通用计算再到 AI 加速的重大转型:
架构代号 | 发布年份 | 核心特性 | 代表产品 |
---|
NV1 / RIVA | 1995–1998 | 固定功能图形加速 | RIVA 128, TNT |
GeForce 256 | 1999 | 首个“GPU”称号,硬件 T&L | GeForce 256 |
Tesla | 2006 | 引入 CUDA,开启 GPGPU | Tesla C870 |
Fermi | 2010 | 双精度计算、ECC 支持 | GTX 480, Tesla C2050 |
Kepler | 2012 | 高能效、动态并行 | GTX 680, Tesla K20 |
Maxwell | 2014 | 更高能效比,深度学习初探 | GTX 980 |
Pascal | 2016 | 支持 NVLink、高速 HBM2 | GTX 1080, Tesla P100 |
Volta | 2017 | 首次引入 Tensor Core | Tesla V100 |
Turing | 2018 | 实时光线追踪 + Tensor Core | RTX 2080 Ti |
Ampere | 2020 | 第二代 RT Core + 第三代 Tensor Core | RTX 3090, A100 |
Hopper / Blackwell | 2022–2024 | 专为 AI 和大模型设计 | H100, B100 |
📊 二、关键技术指标对比(架构级)
架构 | 制程工艺 | CUDA 核心数 | Tensor Core | RT Core | 显存类型 | 主要用途 |
---|
Tesla | 65nm | 128–240 | ❌ | ❌ | GDDR3 | 科学计算 |
Fermi | 40nm | 512 | ❌ | ❌ | GDDR5 | HPC |
Pascal | 16nm | 3584 | ❌ | ❌ | HBM2 | AI训练 |
Volta | 12nm | 5120 | ✅ Gen1 | ❌ | HBM2 | 深度学习 |
Turing | 12nm | 4352 | ✅ Gen2 | ✅ Gen1 | GDDR6 | 游戏 + AI |
Ampere | 8nm | 10496 | ✅ Gen3 | ✅ Gen2 | GDDR6X / HBM2e | AI + 渲染 |
Hopper | 4nm | >18000 | ✅ Gen4 | ✅ Gen3 | HBM3 | 大模型推理 |
🧪 三、应用产品与领域
NVIDIA GPU 被广泛应用于多个行业和产品线:
产品线 | 代表系列 | 应用领域 |
---|
GeForce | RTX 20/30/40/50 | 游戏、创作、消费级图形 |
Quadro / RTX Pro | RTX A6000 | 专业图形设计、CAD、影视制作 |
Tesla / A100 / H100 | Tesla V100, A100, H100 | 数据中心、AI训练、科学计算 |
Jetson | Jetson Nano, Xavier | 边缘 AI、机器人、嵌入式系统 |
DGX 系列 | DGX Station, DGX H100 | 企业级 AI 超算平台 |
Omniverse | Omniverse Enterprise | 元宇宙、数字孪生、协同设计 |
Clara / BioNeMo | Clara Imaging | 医疗影像、基因组学、生命科学 |
🚀 四、发展里程碑简史
年份 | 事件 |
---|
1993 | NVIDIA 成立 |
1999 | 发布 GeForce 256,首次定义“GPU” |
2006 | 推出 CUDA,开启通用 GPU 计算 |
2012 | 支持 AlexNet,推动 AI 革命 |
2018 | 发布 RTX,引入实时光线追踪 |
2020 | Ampere 架构,AI 性能大幅提升 |
2024 | 成为全球市值最高科技公司之一 |