详解AXI Performance Monitor IP核：精准测量AXI总线性能的利器

原创于 2025-10-23 08:00:00 发布 · 1.3k 阅读

33 ·

CC 4.0 BY-SA版权

文章标签：

#fpga开发 #ATG #APM #延时Latancy #性能 #DDR3性能 #吞吐率

FPGA系统：总线接口与Xilinx IP核专栏收录该内容

29 篇文章

订阅专栏

上一篇：详解Xilinx AXI Traffic Generator IP核：AXI4总线性能验证利器

1 引言

在复杂的FPGA系统设计中，AXI总线的性能直接影响整个系统的效率。Xilinx提供的AXI Performance Monitor (APM) IP核正是专门用于测量和分析AXI系统性能的强大工具。

2 APM核心架构与功能

APM IP核通过AXI-Lite接口进行配置，能够精确测量AXI系统的关键性能指标：

核心特性：

支持最多8个监视器插槽，可配置为AXI4内存映射或AXI4-Stream
测量总线延迟、内存流量、吞吐率等关键指标
支持8个外部事件计数，每个都有独立的启动/停止信号
必须连接到设计中的最快时钟（core_aclk）

两大核心模块：

事件日志模块：记录特定事件，帮助重建事务以分析系统行为
事件计数模块：提供硬件计数器，统计与AXI事务相关的事件

3 事件计数机制深度解析

APM的事件计数模块由可配置的累加器和递增器组成（最多10个），其架构如下：

关键组件：

累加器：提供事件的聚合统计值
Range Incrementer：将事件计数与范围寄存器比较，用于统计特定范围内的延迟
计时器：在预设时间间隔内对计数器值进行采样

4 实战演示：四核联动仿真框架

为了深入理解APM的应用，我们搭建了一个完整的仿真系统：完整工程在这里AXI总线性能分析实战工程：ATG+APM+BRAM联合仿真源码资源-优快云下载

4.1 系统架构

AXI Traffic Generator：产生持续的AXI4写数据流
APM：监控总线行为，统计性能指标
AXI BRAM：作为目标存储设备
AXI VIP：配置ATG和APM的工作模式

4.2 地址空间分配

0x4000_0000：AXI GPIO（控制ATG启停）
0x4001_0000：APM寄存器配置
0x0000_0000：AXI BRAM存储空间

5 APM配置与数据采集流程

第一步：初始化配置

mst_agent.AXI4_WRITE_BURST(0,32'h4001_0300,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0002_0002,0,mtestBresp); 
    mst_agent.AXI4_WRITE_BURST(0,32'h4001_0300,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_0051,0,mtestBresp);
    mst_agent.AXI4_WRITE_BURST(0,32'h4000_0000,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_0001,0,mtestBresp);

给0x4001_0300寄存器写0x0002_0002，即复位APM里面的所有计数器，复位全局时钟计数器

给0x4001_0300寄存器写0x0000_0051，即使能APM的所有计数器，使用外部trigger作为计数器开始信号

之后给0x4000_0000写1，即配置ATG开始传输数据。

第二步：中断配置

mst_agent.AXI4_WRITE_BURST(0,32'h4001_0030,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_0001,0,mtestBresp);
    mst_agent.AXI4_WRITE_BURST(0,32'h4001_0034,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_0002,0,mtestBresp);
    mst_agent.AXI4_WRITE_BURST(0,32'h4001_0024,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_1000,0,mtestBresp);
    mst_agent.AXI4_WRITE_BURST(0,32'h4001_0028,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_0002,0,mtestBresp);
    mst_agent.AXI4_WRITE_BURST(0,32'h4001_0028,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,'h0,32'h0000_0001,0,mtestBresp);

给0x4001_0030寄存器写0x0000_0001，使能全局中断；

给0x4001_0034寄存器写0x0000_0002，使能采样间隔计数器溢出中断；

给0x0x4001_0024寄存器写0x0000_1000，即采样间隔，设置为4096个clk进行一次统计。

给0x0x4001_0028寄存器写0x0000_0002，再写0x0000_0001，即将刚才设置的采样间隔导入计数器里面，然后开始向下计数。

第三步：性能数据统计

APM提供丰富的性能统计寄存器：

0x0x4001_0210：写事务计数
0x0x4001_0240：读事务计数
0x0x4001_0200：写byte计数
0x0x4001_0230：读byte计数
0x0x4001_0220：写的总延迟
0x0x4001_0250：读的总延迟
0x0x4001_0254：高16bit—写最大延迟低16bit—写的最小延迟
0x0x4001_0258：高16bit—读最大延迟低16bit—读的最小延迟

task WriteReadCounter ();
    // mst_agent.AXI4_READ_BURST (0,32'h4001_002c,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0210,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    $display("0x210 write trans count = %d decimal",mtestRData[31:0]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0240,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    $display("0x240 read trans count = %d decimal",mtestRData[31:0]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0200,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    write_byte_count[31:0] = mtestRData[31:0];
    $display("0x200 write byte count = %d decimal",mtestRData[31:0]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0230,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    read_byte_count[31:0] = mtestRData[31:0];
    $display("0x230 read byte count = %d decimal",mtestRData[31:0]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0220,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    $display("0x220 write total latency = %d decimal",mtestRData[31:0]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0250,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    $display("0x250 read total latency = %d decimal",mtestRData[31:0]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0254,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    $display("0x254 write minimum latency = %d decimal",mtestRData[15:0]);
    $display("0x254 write maximum latency = %d decimal",mtestRData[31:16]);
    mst_agent.AXI4_READ_BURST (0,32'h4001_0258,0,mtestDataSize,mtestBurstType,mtestLOCK,3,0,0,0,0,mtestRData,mtestRresp,mtestRUSER);
    $display("0x258 read minimum latency = %d decimal",mtestRData[15:0]);
    $display("0x258 read maximum latency = %d decimal",mtestRData[31:16]);
    // $display("write throughput Rate (MB/s) = %.4f ",(write_byte_count*100)/4096);

endtask