[代码阅读]gem5 classic cache初步(3)

本文详细解析了L2缓存接收到内存响应后的处理流程,包括查找块、分配块及数据交换等关键步骤。

下面对cache中的mem_port端的主要操作进行分析:

 

这里我们把前一篇文章(初步2)中的trace图作为我们分析的“航海图”。根据上述的动态航海图,对于从mem端来的数据l2 cache首先调用MemSidePort::recvTiming(),其中主要的代码如下:

 

If(pkt->isRespnse()){

         myCache->handleResponse(pkt);

}else{

         myCache->snoopTiming(pkt);

}

 

这里从航海图可见,在读取内存后,调用的是第一个分支,即handleResponse(PacketPtr pkt),该模块内的主要过程有:

1.       BlkType* blk = tags->findBlock(pkt->getAddr());

         其中的findBlock只是调用set[i].findBlk(),而该函数只是简单地进行如下的遍历:

         for(i=0; i<assoc;i++) 

                if(blks[i]->tag == tag && blks[i]->isValid())

                     return blks[i];

         如果遍历无结果,那么简单的return 0;

 

2.       blk = handleFill(pkt, blk, writebacks);

       如果这里的blk==null,那么就需要进行allocateBlock(addr, writebacks)操作;

       其中的主要操作是tags->findVictim(addr, writebacks);

                    该操作只是简单的抓取 return sets[set].blks[assoc-1];

        然后回到allocateBlock(),如果获得的blk->isValid()那就再进行一些额外的操作,比如dirty 的话,就写回之类。

 

3.       satisfyCpuSideRequest(target->pkt, blk, true, mshr->hasPostDowngrade()):

       主要完成pktblk之间的数据交换工作:

         pkt->isWrite(),则调用 pkt->writeDataToBlock(blk->data, blkSize); blk->status |= BlkDirty;

         pkt->isRead(),则调用pkt->setDataFromBlock(blk->data, blkSize);

 

4.       完成satisfyCpuSideRequest()的操作后,最后需要进行cpuSidePort->respond(target->pkt, completion_time)的操作;

 

 

### 配置与使用 gem5 的 L3 缓存 gem5 是一种模块化的离散事件仿真器,用于模拟计算机系统的各个方面。L3 缓存在多核处理器架构中扮演重要角色,通常作为共享缓存层来减少内存访问延迟并提高性能。 #### 定义系统结构 为了在 gem5 中配置 L3 缓存,首先需要定义整个系统的层次结构。这可以通过创建多个 CPU 核心、私有 L1 和 L2 缓存以及一个共享的 L3 编程实现[^4]。以下是典型的设置方法: ```python from m5.objects import * # 创建两个简单的原子核心 cpu1 = AtomicSimpleCPU() cpu2 = AtomicSimpleCPU() # 为每个 CPU 添加私有的 L1 缓存控制器 l1cache_cpu1 = Cache(size=&#39;32kB&#39;, assoc=8, tag_latency=2, data_latency=2) l1cache_cpu2 = Cache(size=&#39;32kB&#39;, assoc=8, tag_latency=2, data_latency=2) # 将 L1 缓存连接到各自的 CPU cpu1.addPrivateSplitL1Caches(l1cache_cpu1, None) cpu2.addPrivateSplitL1Caches(l1cache_cpu2, None) # 设置共享的 L2 缓存 l2cache = Cache(size=&#39;2MB&#39;, assoc=16, tag_latency=20, data_latency=20) # 连接 L1 到 L2 缓存 bus_to_l2 = Bus(width=16) l1cache_cpu1.connectBus(bus_to_l2) l1cache_cpu2.connectBus(bus_to_l2) l2cache.cpu_side = bus_to_l2.master # 建立 L3 缓存 l3cache = Cache(size=&#39;16MB&#39;, assoc=16, tag_latency=50, data_latency=50) # 使用总线将 L2 缓存连接至 L3 缓存 bus_to_mem = Bus(width=64) l2cache.mem_side = bus_to_mem.slave l3cache.cpu_side = bus_to_mem.master # 最终将 L3 缓存连接到主存储器 root_system = System(mem_mode=&#39;timing&#39;, mem_ranges=[AddrRange(&#39;512MB&#39;)]) root_system.physmem = SimpleMemory(range=root_system.mem_ranges[0]) l3cache.mem_side = root_system.physmem.port ``` 上述代码片段展示了如何构建一个多级缓存体系结构,在此结构中,L3 缓存充当所有 CPU 共享的最后一级高速缓存[^4]。 #### 调整参数 可以根据具体需求调整 L3 缓存大小 (`size`)、关联度 (`assoc`) 及其他属性如 `tag_latency` 或 `data_latency` 来优化性能表现[^5]。 #### 启动仿真 完成配置之后,通过运行以下命令可以启动仿真实验: ```bash build/X86/gem5.opt configs/example/fs.py --num-cpus=2 --caches --l2cache --l3cache-size="16MB" ``` 该命令指定了双核处理单元,并启用了各级缓存支持,其中特别设置了 L3 缓存容量为 16 MB[^6]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值