GPU基本介绍与各GPU性能、价格比较

最新推荐文章于 2025-10-28 15:29:33 发布

原创

最新推荐文章于 2025-10-28 15:29:33 发布 · 1.8w 阅读

42 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #后端

本文介绍了GPU的基本概念，包括CUDA平台、TensorCore在深度学习中的作用、TFLOPS作为性能指标的含义、显存容量与位宽的重要性。此外，还梳理了NVIDIA的GPU架构发展历程，从G80到Ampere，并提及了英伟达在不同场景下的GPU产品分类，如Tesla、Quadro和GeForce。最后，提到了GPU市场的份额情况，NVIDIA占据了大部分独立GPU市场。

1 GPU基本概念

1.1 CUDA

CUDA（Compute Unified Device Architecture），是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。
CUDA核心数量决定了GPU并行处理的能力，在深度学习、机器学习等并行计算类业务下，CUDA核心多意味着性能好一些。

1.2 Tensor(张量) 内核

CUDA是NVIDIA推出的统一计算架构，NVIDIA过去的几乎每款GPU都有CUDA Core，而Tensor Core是最近几年才有的，Tensor Core是专为执行张量或矩阵运算而设计的专用执行单元，而这些运算正是深度学习所采用的核心计算函数。Tensor核心在训练方面能够提供高达12倍的teraflops (TFLOPS) 峰值，而在推理方面则可提供6倍的TFLOPS峰值。每个Tensor核心每个时钟周期可执行64次浮点混合乘加 (FMA) 运算。
在这里插入图片描述