内存层次结构优化与Tiger语言基础
1. 循环交换(Loop Interchange)
1.1 有效利用缓存的基础
有效利用缓存的最基本方法是重用缓存数据。在嵌套循环访问内存时,循环的连续迭代常常会重用相同的字,或者使用占据同一缓存块的相邻字。若最内层循环的迭代重用相同的值,就会有很多缓存命中;但要是外层循环中的某一个重用缓存块,内层循环的执行可能会大量占用缓存,以至于到下一次外层循环迭代执行时,缓存块可能已被刷新。
1.2 示例分析
以下是一个嵌套循环的示例:
for i ←0 to N −1
for j ←0 to M −1
for k ←0 to P −1
A[i, j, k] ←(B[i, j −1, k] + B[i, j, k] + B[i, j + 1, k])/3
在这个示例中, B[i, j + 1, k]
在 j
循环的下一次迭代中会被重用(此时它的“名称”变为 B[i, j, k]
),并在之后的迭代中再次被重用。然而,与此同时, k
循环会将 B
数组的 3P 个元素和 A
数组的 P 个元素通过缓存。这些字中的一些很可能会与 B[i, j + 1, k]
发生冲突,导致下次获取它时出现缓存未命中的情况。