复习目录
第一章 加速比 MTTF计算
第二章 扫目录 优化cache
第三章 重点 ILP
第四章 向量体系结构 简答
第五章 集中式共享储存器体系结构 简答
第六章 扫目录 WSC
附录A 指令集 各种概念
附录B cache 性能分析计算
附录C 流水线 确定计算过程 性能计算 画时空图
概念总结
PMD 个人移动设备
WSC 仓库级计算机
嵌入式
服务器
桌面计算
ILP 指令级并行 Instruction 潜在并行
DLP 数据级并行 Data 显式并行
TLP 线程级并行 Thread 显
RLP 请求级并行 Request 显
Flynn分类 S/MI+S/MD
MTTF 正常生产到发生下一次故障的时间
故障率的倒数
MTTR 平均修复时间
MTBF 两者相加
register 寄存器
memory 储存器
指令类型
RR RM MM
CPI 每条指令执行所需的时钟周期
IC 指令数
CPU时间=ICxCPIx时钟周期时间
CISC 复杂指令集计算机
强化指令功能 软件功能转给硬件
缺点复杂 慢 20%指令占80%时间
RISC 精简指令集计算机
字节8位 半字16位 单字32位 双字64位
MIPS 一种采取RISC的处理器架构
MIPS速率=主频/CPI
MIPS基本流水线:
IF取指令
ID指令译码/读寄存器
EX执行/有效地址计算
MEM访存/分支操作
WB写回
通用浮点流水线的延迟表
基本流水线调度👉克服数据先写后读相关停顿
循环展开👉控制相关停顿
动态调度 克服数据冒险 各种数据相关停顿:
计分牌算法
Tomasulo算法
Issue取指令 保留站空闲则发射指令&操作数
Execution 就绪则执行操作 否则等待EX
Write Back完成执行 标记保留站可用WB
数据相关带来的冲突
RAW写后读
WAW写后写
WAR读后写
吞吐率TP=n个结果(最后一个方块数)/流水T
加速度S=非流水T/流水T
效率E=涂色方块 / 所有方块
n个任务时间/m个段总时间
加速比/最大加速比
块的放置 全相连映象 直接映象 组相连映象
块的查找 查目录表
块的替换 随机法/FIFO/LRU最常使用/LFU
块的写入 写直达法 简单 写主存
/写回法 快 不写主存
写缓冲器:两者结合
多级储存系统 局部性原理
cache性能参数
S 容量
C 平均每位价格 C1S1+C2S2/S1+S2
H 命中率 N1/N1+N2 访问M1/M2的次数
F 失效率 1-H
T平均访问时间=命中时间+缺失时间缺失代价
(重点) T1 + FTm
停顿周期数=访存次数F失效开销
CPU访问时间=IC*(CPI+每条指令平均储存器停顿周期数)*时钟周期
优化cache的三个方面
降低失效率
减少失效开销
减少cache命中时间
三种缺失👇
强制缺失
容量缺失
冲突缺失
六种优化👇
增大块大小👉强制缺失👉降低缺失率
增大缓存👉容量缺失👉降低缺失率
提高相联度👉冲突缺失👉降低缺失率
多级缓存👉冲突缺失👉降低缺失开销
读取缺失优先级高于写入缺失👉降低开销
避免索引缓存期间地址转换👉减少命中时间
多级缓存
L1的缺失开销=L2的平均访问时间
每条指令平均储存器停顿值=
(平均访问时间-L1命中时间)*每条指令访存次数
VMIPS 向量长距离指令集结构
缓存一致性协议
目录式 集中目录
监听式 跟踪共享状态
集群是WSC子集