VLIW架构:编译器算法与指令调度技术解析
1. 引言
在VLIW(超长指令字)架构中,局部静态调度不足以充分挖掘指令级并行性(ILP),需要全局调度技术。本文将深入探讨VLIW架构中的编译器算法,包括循环展开、软件流水、解决WAR(写后读)冒险的旋转寄存器技术、操作槽冲突处理、循环携带依赖以及非循环VLIW调度等内容。
2. 代码示例与VLIW调度基础
首先,我们来看一个简单的代码示例:
FOR (i = 1000; i > 0; i = i-1)
x[i] = x[i] + s
该代码编译后的形式为:
Loop:
L.D F0, 0(R1)
ADD.D F4, F0, F2
S.D F4, 0(R1)
SUBI R1,R1,#8
BNE R1,R2, Loop
对于VLIW架构,局部静态调度无法充分暴露ILP,因此需要全局调度。全局调度可分为循环和非循环两种类型。下面我们先介绍循环展开技术。
3. 循环展开
循环展开是一种循环全局调度技术,其步骤包括展开循环、移除分支指令、调整内存位移和重命名寄存器,然后重新组织代码以优化VLIW调度。
假设对上述示例的循环展开七次,得到的VLIW程序如下表所示(假设全转发):
| 时钟 | MemOpI | MemOp2 | FPOpI | FPOp2 | Int
超级会员免费看
订阅专栏 解锁全文
159

被折叠的 条评论
为什么被折叠?



