4. cache预取
背景:cache操作对大多数程序员透明,但当对程序执行效率有很高要求的时候,程序员可以一定程度上控制cache。
4.1 Cache局部性
①时间局部性:程序即将用到的指令或数据,可能就是目前正在使用的指令或数据,可以在当前的指令数据使用完后暂存在cache中。典型的例子就是for循环。
②空间局部性:程序即将使用的指令或数据可能与目前正在使用的指令或数据在空间上相邻或相近。所以可以在处理当前指令数据时,把内存中相邻区域的指令或数据也读到cache里。典型的例子就是处理数组。
4.2 预取
NetBurst架构硬件预取:有两个硬件预取单元,分别对应数据和指令,激活后可以自动预取下一个cache line的数据。预取只发生在同一个页内,不会预取到其他页。
实例:对二维数组arr[1024][1024]赋值
for(int i = 0; i < 1024; i++) for(int j = 0; j < 1024; j++) arr[i][j] = 1; }
|
for(int i = 0; i < 1024; i++) for(int j = 0; j < 1024; j++) arr[j][i] = 1; }
|
左边的在内存中顺序访问,硬件可以识别规律,完成预取,提高效率。而右边的代码对内存的访问时

本文深入探讨了DPDK中与cache相关的话题,包括cache预取原理,如时间、空间局部性和预取指令,以及在处理报文过程中的应用。同时,文章讲解了cache一致性问题,如cache line对齐和MESI协议,强调了DPDK如何通过避免数据共享来确保cache一致性。
最低0.47元/天 解锁文章
1409

被折叠的 条评论
为什么被折叠?



