58、计算机硬件架构与微操作详解

计算机硬件架构与微操作详解

1. Intel Gen8 GPU架构概述

1.1 执行单元(EU)

Intel Gen8 GPU架构的基本构建块是执行单元(EU)。EU采用同时多线程(SMT)架构,拥有七个线程,实现为超标量流水线架构。每个线程包含128个通用寄存器,每个寄存器存储32字节,可作为32位数据元素的SIMD 8元素向量访问。因此,每个Gen8线程有4 kB的通用寄存器文件(GRF),每个EU总共有28 kB的GRF。

EU内的主要计算单元是两个支持浮点和整数计算的SIMD浮点单元,每个SIMD FPU每周期可以同时完成加法和乘法浮点指令。此外,还有一个专门用于分支指令的分支单元和一个用于内存操作的发送单元。

EU可以同时从不同线程发出多达四条不同的指令,线程仲裁器将每条指令分配到四个功能单元之一进行执行。

1.2 子切片(Subslice)

EUs被组织成子切片,每个子切片最多可包含八个EU。每个子切片有自己的本地线程调度器单元和支持的指令缓存,因此单个子切片拥有专用硬件资源和寄存器文件,总共可支持56个并发线程。

子切片还包括一个名为采样器的单元,有自己的本地L1和L2缓存,用于采样纹理和图像表面。采样器包含支持块压缩纹理格式动态解压缩的逻辑,以及实现图像(u,v)坐标地址转换和地址钳位模式(如镜像、环绕、边界和钳位)的固定功能逻辑,支持多种采样过滤模式,如点、双线性、三线性和各向异性。数据端口提供高效的读写操作,尝试利用缓存行大小来合并不同线程的读操作。

1.3 切片(Slice)

为了创建产品变体,子切片可以聚集成组,称为切片。目前

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值