gpu相关内容，带宽，显存，填充率等

最新推荐文章于 2025-10-27 16:00:35 发布

原创最新推荐文章于 2025-10-27 16:00:35 发布 · 7.3k 阅读

14 ·

CC 4.0 BY-SA版权

图形图像音频专栏收录该内容

15 篇文章

订阅专栏

本文深入解析显卡关键性能指标，包括显存位宽、显存带宽、像素填充率、材质填充率等，阐述其计算原理及对显卡性能的影响，并介绍了TBDR技术及其优势。

部署运行你感兴趣的模型镜像

1、

bus width：显存位宽

bandwidth：显存带宽

显存位宽 * 显存频率 / 8 = 显存带宽

以740显卡为例

显存位宽是128bit，显存频率是5Gbps

显存带宽就是80GB/s

计算显存带宽时要留意显存类型(Memory Type)，对于GDDR1/2/3/4显存，其数据总线都是采用的DDR技术(通过差分时钟在上升沿和下降沿都进行数据传输，其一个周期传输两次数据，相当于SDRAM频率的2倍)，故其显存等效频率=显存频率×2；而GDDR5则不同，它有两条数据总线，相当于Rambus的QDR技术，传输能力相当于SDRAM频率的4倍，所以显存等效频率=显存频率×4.

上面的5Gbps就是1250*4得来的

2、pixel fillrate

像素填充率

现阶段的显卡都是非统一架构的，也就是分为顶点渲染和像素渲染。那么在显示核心的内部就分为两大区域，一个区域就是顶点渲染单元（也叫顶点着色或顶点着色引擎），主要负责描绘图形，也就是建立模形。一个就是像素渲染管线（也叫像素渲染管道），主要负责把顶点绘出的图形填上填色。然后再加上纹理贴图单元贴上纹理，一个精美的图形就出来了。

像素填充率是指图形处理单元在每秒内所渲染的像素数量，单位是MPixel/S（每秒百万像素），或者GPixel/S（每秒十亿像素），是用来度量当前显卡的像素处理性能的最常用指标。GPU-Z上是那个

他的计算方式是：显示核心的渲染管线数量 * 核心频率

ROP * clock = 16 * 1072

ROP用来反锯齿处理，是render的最后一步，单元数量越多越好

3、texture fillrate

材质填充率

核心频率 * 像素渲染管线数量* 纹理贴图单元数量

TMUs * clock = 1072 * 32,其中纹理贴图单元数量为2

4、

显存 VM video memory

集显用的是内存的一部分，一般会分256MB或者512MB，还有另外一种独显，独显有自己的VM

5、

光栅处理单元

ROP

6、TBDR（转个人学习用）

作者：Vinjn张静

链接：https://www.zhihu.com/question/29263330/answer/43924233

来源：知乎

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

TBDR ＝ Tile-Based Deferred Rendering，包含两点：

TB，基于格子的渲染，把屏幕分成一个个小格子，以小格子为单位并行处理。有啥好处呢，因为格子小，所需要的 color buffer 和 depth buffer 也小，那么可以通通塞进缓存里。缓存的优点是飞一样的话，然后省电，也降低了带宽的消耗。总之就是好好好，适合手机。

DR，延迟渲染，基本概念是只对玩家能看到到像素调用 pixel shader。怎么才能知道玩家看的到呢？自然是通过比较 depth value，也就是在进入 pixel shader 之前就得到最终展示在屏幕上的像素的 depth value。优点大大的，可以减少不必要的 pixel shader 调用次数，也就是提速＋省电。

DR 这块该公司特意申请了专利的，牛！