计算机硬件架构与微操作详解
1. Intel Gen8 GPU架构概述
1.1 执行单元(EU)
Intel Gen8 GPU架构的基本构建块是执行单元(EU)。EU采用同时多线程(SMT)架构,拥有七个线程,实现为超标量流水线架构。每个线程包含128个通用寄存器,每个寄存器存储32字节,可作为32位数据元素的SIMD 8元素向量访问。因此,每个Gen8线程有4 kB的通用寄存器文件(GRF),每个EU总共有28 kB的GRF。
EU内的主要计算单元是两个支持浮点和整数计算的SIMD浮点单元,每个SIMD FPU每周期可以同时完成加法和乘法浮点指令。此外,还有一个专门用于分支指令的分支单元和一个用于内存操作的发送单元。
EU可以同时从不同线程发出多达四条不同的指令,线程仲裁器将每条指令分配到四个功能单元之一进行执行。
1.2 子切片(Subslice)
EUs被组织成子切片,每个子切片最多可包含八个EU。每个子切片有自己的本地线程调度器单元和支持的指令缓存,因此单个子切片拥有专用硬件资源和寄存器文件,总共可支持56个并发线程。
子切片还包括一个名为采样器的单元,有自己的本地L1和L2缓存,用于采样纹理和图像表面。采样器包含支持块压缩纹理格式动态解压缩的逻辑,以及实现图像(u,v)坐标地址转换和地址钳位模式(如镜像、环绕、边界和钳位)的固定功能逻辑,支持多种采样过滤模式,如点、双线性、三线性和各向异性。数据端口提供高效的读写操作,尝试利用缓存行大小来合并不同线程的读操作。
1.3 切片(Slice)
为了创建产品变体,子切片可以聚集成组,称为切片。目前
超级会员免费看
订阅专栏 解锁全文
1178

被折叠的 条评论
为什么被折叠?



