【期末总结】计算机体系结构

复习目录

第一章 加速比 MTTF计算
第二章 扫目录 优化cache
第三章 重点 ILP
第四章 向量体系结构 简答
第五章 集中式共享储存器体系结构 简答
第六章 扫目录 WSC

附录A 指令集 各种概念
附录B cache 性能分析计算
附录C 流水线 确定计算过程 性能计算 画时空图

概念总结

PMD 个人移动设备
WSC 仓库级计算机
嵌入式
服务器
桌面计算

ILP 指令级并行 Instruction 潜在并行
DLP 数据级并行 Data 显式并行
TLP 线程级并行 Thread 显
RLP 请求级并行 Request 显

Flynn分类 S/MI+S/MD

MTTF 正常生产到发生下一次故障的时间
故障率的倒数
MTTR 平均修复时间
MTBF 两者相加

register 寄存器
memory 储存器

指令类型
RR RM MM

CPI 每条指令执行所需的时钟周期
IC 指令数

CPU时间=ICxCPIx时钟周期时间

CISC 复杂指令集计算机
强化指令功能 软件功能转给硬件
缺点复杂 慢 20%指令占80%时间
RISC 精简指令集计算机

字节8位 半字16位 单字32位 双字64位

MIPS 一种采取RISC的处理器架构
MIPS速率=主频/CPI

MIPS基本流水线:
IF取指令
ID指令译码/读寄存器
EX执行/有效地址计算
MEM访存/分支操作
WB写回

通用浮点流水线的延迟表
基本流水线调度👉克服数据先写后读相关停顿
循环展开👉控制相关停顿

动态调度 克服数据冒险 各种数据相关停顿:
计分牌算法

Tomasulo算法
Issue取指令 保留站空闲则发射指令&操作数
Execution 就绪则执行操作 否则等待EX
Write Back完成执行 标记保留站可用WB

数据相关带来的冲突
RAW写后读
WAW写后写
WAR读后写

吞吐率TP=n个结果(最后一个方块数)/流水T
加速度S=非流水T/流水T
效率E=涂色方块 / 所有方块
n个任务时间/m个段总时间
加速比/最大加速比

块的放置 全相连映象 直接映象 组相连映象
块的查找 查目录表
块的替换 随机法/FIFO/LRU最常使用/LFU
块的写入 写直达法 简单 写主存
/写回法 快 不写主存
写缓冲器:两者结合

多级储存系统 局部性原理

cache性能参数
S 容量
C 平均每位价格 C1S1+C2S2/S1+S2
H 命中率 N1/N1+N2 访问M1/M2的次数
F 失效率 1-H
T平均访问时间=命中时间+缺失时间缺失代价
(重点) T1 + F
Tm
停顿周期数=访存次数F失效开销
CPU访问时间=IC*(CPI+每条指令平均储存器停顿周期数)*时钟周期

优化cache的三个方面
降低失效率
减少失效开销
减少cache命中时间

三种缺失👇
强制缺失
容量缺失
冲突缺失

六种优化👇
增大块大小👉强制缺失👉降低缺失率
增大缓存👉容量缺失👉降低缺失率
提高相联度👉冲突缺失👉降低缺失率
多级缓存👉冲突缺失👉降低缺失开销
读取缺失优先级高于写入缺失👉降低开销
避免索引缓存期间地址转换👉减少命中时间

多级缓存
L1的缺失开销=L2的平均访问时间

每条指令平均储存器停顿值=
(平均访问时间-L1命中时间)*每条指令访存次数

VMIPS 向量长距离指令集结构

缓存一致性协议
目录式 集中目录
监听式 跟踪共享状态

集群是WSC子集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值