0. 前言
因为 [体系结构] 课程实验 要用C语言测量Cache的相关参数,而现在的编译器和处理器架构已经把Cache优化得非常极致了,所以测量挺困难的,经常会出现现象不明显的情况。加之指导书能提供的帮助太少,网络上也没有太多资料,所以就来写写自己实现的比较好的方法。
这里只写了测L1 Cache相联度的方法,L2 Cache相联度的测法目前我也不太清楚,希望能抛砖引玉。其他例如测量Cache容量,块大小的方法也会之后写一下吧。
写这个的动机其实是觉得实验指导书上的方法不太值得推敲(反正我照着写基本没跑出像样结果),而且好像没有人特别详细写过这一类的实验(鬼才设计的实验),指导书上的方法我也会在末尾给出,提供参考。
1. Cache 组相联
在我们开始用C语言代码测量Cache的相联度之前,需要先简单复习一下什么是组相联。Cache的地址映射方式有直接映射、全相联映射和组相联映射。组相联映射是目前CPU中普遍使用的策略。
以8路组相联为例,L1 Cache的大小为32KB,Cache Line Size 为64B(即每一个Cache块的大小,从内存向Cache传数据都是以Cache块为单位的),则整个L1 Cache一共有32KB / 64B = 512块。
上面关于L1 Cache的相关参数是笔者正在用的计算机的实际参数,大概也适用于市面上大部分计算机。
将整个L1 Cache分为若干组,8路组相联那么每组就是8个Cache 块,一共512 / 8 = 64个组,同时我们申请一个2倍Cache大小的一维数组,这块内存空

本文介绍了如何使用C语言测量L1 Cache的相联度,通过理解组相联映射原理,设计特定的C程序,观察不同组相联情况下的访问时间变化,从而确定Cache的相联度。实验表明,通过对比不同步长访问所需时间,可以判断出8路组相联。此外,文章还讨论了实验指导书中方法的局限性。
最低0.47元/天 解锁文章
5129

被折叠的 条评论
为什么被折叠?



