CPU和GPU擅长和不擅长的方面

本文对比分析了CPU和GPU在微架构、主频及指令执行效率等方面的差异,指出了它们各自擅长的应用场景,如CPU适合操作系统及通用计算,GPU则在图形矩阵运算及并行数值计算方面表现出色。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CPU和GPU擅长和不擅长的方面

 

作者 赵军, 2008年6月19日

今天讨论的论题是CPU和GPU“擅长和不擅长”的各个方面,而不是谁取代谁的问题。我试着从它们执行运算的速度与效率的方面来探讨这个论题。

CPU和GPU都是具有运算能力的芯片,CPU更像“通才”——指令运算(执行)为重+ 数值运算,GPU更像“专才”——图形类数值计算为核心。在不同类型的运算方面的速度也就决定了它们的能力——“擅长和不擅长”。芯片的速度主要取决于三个方面:微架构,主频和IPC(每个时钟周期执行的指令数)。

1.微架构

从微架构上看,CPU和GPU看起来完全不是按照相同的设计思路设计的,当代CPU的微架构是按照兼顾“指令并行执行”和“数据并行运算”的思路而设计,就是要兼顾程序执行和数据运算的并行性、通用性以及它们的平衡性。CPU的微架构偏重于程序执行的效率,不会一味追求某种运算极致速度而牺牲程序执行的效率。

CPU微架构的设计是面向指令执行高效率而设计的,因而CPU是计算机中设计最复杂的芯片。和GPU相比,CPU核心的重复设计部分不多,这种复杂性不能仅以晶体管的多寡来衡量,这种复杂性来自于实现:如程序分支预测,推测执行,多重嵌套分支执行,并行执行时候的指令相关性和数据相关性,多核协同处理时候的数据一致性等等复杂逻辑。

GPU其实是由硬件实现的一组图形函数的集合,这些函数主要用于绘制各种图形所需要的运算。这些和像素,光影处理,3D 坐标变换等相关的运算由GPU硬件加速来实现。图形运算的特点是大量同类型数据的密集运算——如图形数据的矩阵运算,GPU的微架构就是面向适合于矩阵类型的数值计算而设计的,大量重复设计的计算单元,这类计算可以分成众多独立的数值计算——大量数值运算的线程,而且数据之间没有像程序执行的那种逻辑关联性。

GPU微架构复杂度不高,尽管晶体管的数量不少。从应用的角度看,如何运用好GPU的并行计算能力主要的工作是开发好它的驱动程序。GPU驱动程序的优劣很大程度左右了GPU实际性能的发挥。

因此从微架构上看,CPU擅长的是像操作系统、系统软件和通用应用程序这类拥有复杂指令调度、循环、分支、逻辑判断以及执行等的程序任务。它的并行优势是程序执行层面的,程序逻辑的复杂度也限定了程序执行的指令并行性,上百个并行程序执行的线程基本看不到。GPU擅长的是图形类的或者是非图形类的高度并行数值计算,GPU可以容纳上千个没有逻辑关系的数值计算线程,它的优势是无逻辑关系数据的并行计算。

2.主频

另外,GPU执行每个数值计算的速度并没有比CPU快,从目前主流CPU和GPU的主频就可以看出了,CPU的主频都超过了1GHz,2GHz,甚至3GHz,而GPU的主频最高还不到1GHz,主流的也就500~600MHz。要知道1GHz = 1000MHz。所以GPU在执行少量线程的数值计算时并不能超过CPU。

目前GPU数值计算的优势主要是浮点运算,它执行浮点运算快是靠大量并行,但是这种数值运算的并行性在面对程序的逻辑执行时毫无用处。

3.IPC(每个时钟周期执行的指令数)

这个方面,CPU和GPU无法比较,因为GPU大多数指令都是面向数值计算的,少量的控制指令也无法被操作系统和软件直接使用。如果比较数据指令的IPC,GPU显然要高过CPU,因为并行的原因。但是,如果比较控制指令的IPC,自然是CPU的要高的多。原因很简单,CPU着重的是指令执行的并行性。

另外,目前有些GPU也能够支持比较复杂的控制指令,比如条件转移、分支、循环和子程序调用等,但是GPU程序控制这方面的增加,和支持操作系统所需要的能力CPU相比还是天壤之别,而且指令执行的效率也无法和CPU相提并论。

最后总结一下:

CPU擅长的:操作系统,系统软件,应用程序,通用计算,系统控制等等;游戏中人工智能,物理模拟等等;3D建模-光线追踪渲染;虚拟化技术——抽象硬件,同时运行多个操作系统或者一个操作系统的多个副本等等。

GPU擅长的:图形类矩阵运算,非图形类并行数值计算,高端3D游戏。

综上所述,在一台均衡计算的计算机系统中,CPU和GPU还是各司其职,除了图形运算,GPU将来可能主要集中在高效率低成本的高性能并行数值计算,帮助CPU分担这种类型的计算,提高系统这方面的性能。而当前的典型应用还是高端3D游戏,一个高效的GPU配合一个高效的CPU,3D游戏的整体效率才能得到保证。“高端3D游戏只需要高端显卡”或者“高端3D游戏只需要CPU”都是无稽之谈。

转自:http://intelchina.163tech.blog.163.com/blog/static/6709398320085199182711/

### CPU GPU 的区别与联系 #### 架构差异 中央处理器 (CPU) 是通用型微处理器,专为处理各种类型的计算任务而设计。现代 CPU 通常具有少量的核心(通常是 2 到几十个),这些核心被优化用于顺序串行处理。每个核心都具备复杂的控制逻辑大容量缓存来支持高效的单线程性能。 相比之下,图形处理单元 (GPU) 原本是为了加速计算机图形渲染而开发的专用协处理器。随着时间的发展,GPU 已经演变成能够并行执行大量简单指令的强大工具。GPU 包含成百上千个小而简单的处理单元,非常适合高度并行化的数据密集型操作[^1]。 ```cpp // 示例:CPU 上运行的任务可能是这样子的 for(int i = 0; i < N; ++i){ result[i] = someComplexFunction(data[i]); } // 而在 GPU 中可以并发地分配给多个线程 __global__ void kernel(float* data, float* result){ int idx = blockIdx.x * blockDim.x + threadIdx.x; if(idx < N) result[idx] = simpleOperation(data[idx]); } ``` #### 应用场景 由于其强大的浮点运算能力高带宽内存访问特性,GPU 特别适合于机器学习中的矩阵乘法其他大规模数值计算工作负载。另一方面,在涉及复杂决策路径的应用程序中,比如操作系统管理应用程序执行方面,CPU 表现得好因为它们擅长分支预测以及乱序执行等技术以提高效率[^2]。 #### 设计理念上的共同之处 尽管存在上述显著的同点,但在某些层面上两者也有相似之处: - **可编程性**:无论是 CPU 还是 GPU 都是可以编写软件来进行同种类工作的设备; - **资源共享机制**:二者内部都有一定的资源管理策略用来协调多任务间的竞争情况; - **功耗考虑因素**:随着摩尔定律逐渐失效,如何平衡性能与能耗成为两者的共同挑战之一; 通过理解这两种架构的特点及其适用范围可以帮助开发者好地选择合适的硬件平台去实现特定算法或应用需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值