GPU从大的方面来讲,就是由显存和计算单元组成:
- 显存(Global Memory):显存是在GPU板卡上的DRAM,类似于CPU的内存,就是那堆DDR啊,GDDR5啊之类的。特点是容量大(可达16GB),速度慢,CPU和GPU都可以访问。
- 计算单元(Streaming Multiprocessor):执行计算的。每一个SM都有自己的控制单元(Control Unit),寄存器(Register),缓存(Cache),指令流水线(execution pipelines)。
GFLOPS:十亿次
TFLOPS:一万亿次
Shader主要编辑顶点着色器和片元着色器来影响渲染效果。
GPU设计思路:
算术逻辑单元(arithmetic and logic unit) 是能实现多组算术运算和逻辑运算的组合逻辑电路,简称ALU。
停滞(stalls)
NVidia Kepler架构:
SMX是SM的升级版。
评价GPU的标准一般而言有两条:
1,单精度浮点数计算能力,双精度浮点数计算能力;
2,数据传输带宽
3,对于嵌入式系统的GPU来说,还会增加一条是功耗。