算力的灵魂：GPU与显存

原创已于 2025-12-27 18:44:53 修改 · 609 阅读

·

12

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#GPU #显存 #CPU

于 2025-12-27 16:00:11 首次发布

NLP基础专栏收录该内容

10 篇文章

订阅专栏

文章目录

1. CPU vs GPU

要理解 CPU 和 GPU 的区别，我们先抛开复杂的电路图，用一个经典的 “算力剧场” 来打比方。

1.1 CPU：博学的“老教授”

角色：一位资深的数学教授。
特长：他极其聪明，懂得微积分、逻辑推理、复杂的条件判断。他能处理极其复杂的任务，比如管理操作系统、运行复杂的逻辑脚本。
弱点：他只有一个人（或者几个分身，即核心数少），虽然单兵作战能力极强，但如果让他去搬砖，效率就很低。

1.2 GPU：成千上万的“小学生军团”

角色：一个由 5000 名小学生组成的方阵。
特长：他们每个人只会做简单的加减乘除（浮点运算），不懂复杂的逻辑。但他们人多势众，可以同时做 5000 道简单的数学题。
弱点：单拎出来一个，能力远不如教授。且不擅长处理复杂的逻辑跳转（If-Else）。

1.3 显存 (VRAM)：军团的“课桌”

角色：摆在小学生面前的超大课桌。
特长：离小学生非常近，存取速度极快。
作用：如果让这 5000 个小学生每做一道题都要跑去图书馆（系统内存 RAM）查资料，那大部分时间都花在路上了。显存就是为了保证数据就在手边，伸手就能拿到。

2. 架构层面的本质差异

让我们深入芯片内部，看看它们的“大脑构造”有何不同。

2.1 芯片面积分配 (Die Map)

CPU：大部分面积都用来做控制单元（指挥交通）和缓存（Cache），真正的计算单元（ALU）占比并不大。这是为了降低延迟（Latency）。
GPU：几乎整个芯片密密麻麻全是计算单元（ALU）。它不在乎单个任务多快，它在乎的是吞吐量（Throughput）。

3. 显存 (VRAM)：被忽视的性能瓶颈

既然 GPU 有成千上万个核心（小学生），这就带来了一个巨大的后勤问题：如何在一秒钟内给这几千张嘴喂饭？

这就是显存存在的意义。

3.1 为什么不能用电脑内存 (RAM)？

你可能会问：“我有 64GB 的电脑内存，为什么显卡还要自己带 12GB 显存？”

答案在于带宽 (Bandwidth)，也就是路有多宽。

CPU + 内存 (DDR)：像法拉利跑车。追求低延迟，反应快，但一次只能运送几个包裹。
GPU + 显存 (GDDR/HBM)：像巨型货运火车。反应可能没跑车快，但一次能拉成吨的货物。

带宽对比直观感受：

如果强行让 GPU 去读取系统内存，GPU 核心会有 90% 的时间在空转等待数据，这就是所谓的“显存瓶颈”。

3.2 显存里到底存了什么？

显存是 GPU 的私有仓库，根据应用场景不同，里面的货物也不同：

场景	显存里的主要内容	爆显存后果
3D 游戏	纹理贴图 (4K皮肤)、帧缓冲 (画面)、几何数据	游戏帧数瞬间暴跌，出现严重卡顿 (Stuttering)
AI 训练/推理	模型权重 (Weights)、KV Cache (上下文记忆)、激活值	程序直接报错崩溃 (Out of Memory)，无法运行

4. 实际应用场景解析

4.1 渲染一张 4K 游戏画面

CPU (教授)：告诉 GPU：“把那个怪物画在坐标 (x,y)，它手里拿着枪。”
显存 (课桌)：已经预先加载好了怪物的皮肤贴图、枪械模型数据。
GPU (小学生)：几千个核心同时开工。
- 核心 A 组：计算光线怎么照在怪物脸上。
- 核心 B 组：计算枪口的火焰特效。
- 核心 C 组：从显存里抓取皮肤贴图，贴在模型上。
输出：最终画面生成，存入显存的帧缓冲区，发送给显示器。

4.2 训练一个 AI 模型 (如 ChatGPT)

显存 (课桌)：塞满了巨大的矩阵数据（模型参数）。
GPU (小学生)：进行海量的矩阵乘法运算。
- 这是一种高度并行的重复计算，不需要复杂的逻辑判断，正是“小学生军团”的最爱。
带宽挑战：每一层神经网络计算完，都要快速读写显存。如果显存带宽不够（比如用了普通内存），AI 训练速度会慢如蜗牛。

计算机的强大，源于 CPU、GPU 和显存的完美配合。

CPU 是统帅，负责复杂的逻辑调度，处理序列任务。
GPU 是大军，负责暴力的并行计算，处理图形和矩阵。
显存是粮道，负责提供超高带宽的数据吞吐，确保大军不会断粮。

选购建议：

如果你玩《文明6》这种策略游戏，或者做复杂的代码编译，你需要一个好 CPU。
如果你玩《赛博朋克 2077》或者搞 AI 绘画，你需要一个好 GPU。
如果你想开 4K 分辨率或者炼大模型，请务必盯着显存容量和带宽看，否则核心再强也发挥不出来。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

TracyCoder123 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。