CSAPP cache lab part B
矩阵转置
矩阵转置是一种操作,它将矩阵的行和列互换位置,即将原始矩阵的行变为转置矩阵的列,将原始矩阵的列变为转置矩阵的行。转置操作可以通过改变矩阵的布局来方便地进行某些计算和分析。
假设有一个m×n的矩阵A,其转置矩阵为n×m的矩阵B。那么B的第i行第j列的元素就是A的第j行第i列的元素,即B[i][j] = A[j][i]。
例如,对于以下矩阵A:
A = [ 1 2 3 ]
[ 4 5 6 ]
其转置矩阵B为:
B = [ 1 4 ]
[ 2 5 ]
[ 3 6 ]
可以看到,B的第一行是A的第一列,B的第二行是A的第二列,以此类推。
矩阵转置在很多领域中都有广泛的应用,例如线性代数、图像处理、矩阵运算等。它可以用于求解线性方程组、计算矩阵的逆、矩阵相乘等操作。在编程中,可以使用循环和临时变量来实现矩阵转置,也可以使用现有的矩阵库或数学库提供的函数来完成转置操作。
part B 背景

已经实现了矩阵转置函数,需要通过提高cache hit的方式,提高性能。
int 类型通常是4bytes。
3种格式的矩阵:

预期:

cache 的参数:
s = 5, E = 1, b = 5

使用 cache blocking 优化 Matrix Transpose

执行matrix transpose 函数:
./test-trans -M 32 -N 32
test-trans 会生成 trace.f0 和trace.f1文件,
./csim-ref -v -s 5 -E 1 -b 5 -t trace.f0 | less

32 x 32 的case, 使用分块将miss从1183降低到了343。
对于32 x 32:
A[0][0] 的地址:602100 - A[0][7], set: 8
A[8][0] 的地址:602500 - A[8][7], set: 8
B[0][0] 的地址:642100 - B[0][7], set: 8
B[8][0] 的地址:642500 - B[8][7], set: 8
建议bszie 为8。

但是64 x 64的case 的miss 没有降低。
对于64 x 64:
A[0][0] 的地址:6021

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



