Xilinx AXI Video Direct Memory Access IP (PG020) 详细介绍
概述
Xilinx AXI Video Direct Memory Access (AXI VDMA) LogiCORE™ IP 核(PG020)是一个软核 IP,专为视频应用设计,提供在内存与 AXI4-Stream 视频外设之间的高带宽直接内存访问(DMA)。该 IP 核支持高效的二维 DMA 操作,具备独立的异步读写通道,能够处理视频帧缓冲和实时视频流传输。它通过 AXI4-Lite 从接口访问初始化、状态和中断管理寄存器,广泛应用于视频处理系统。AXI VDMA 支持多种 AMD FPGA 系列,适用于嵌入式视频系统、显示接口和专业视频设备。
主要特性
- 接口:
- 输入/输出:支持 AXI4-Stream 视频协议(符合 Vivado AXI Reference Guide UG1037),用于视频数据传输。
- 控制:AXI4-Lite 从接口,用于配置和状态监控。
- 内存:AXI4 主接口,连接到外部内存(如 DDR3/4)。
- 通道:
- MM2S(Memory-Mapped to Stream):从内存读取视频数据,输出到 AXI4-Stream。
- S2MM(Stream to Memory-Mapped):从 AXI4-Stream 接收视频数据,写入内存。
- 读写通道独立异步操作,支持不同时钟域。
- 数据宽度:
- 可配置数据宽度(8/16/24/32/64/128/256/512/1024 位)。
- 支持多种视频格式(如 RGB、YUV 4:4:4、YUV 4:2:2)。
- 帧缓冲:
- 支持多达 32 个帧缓冲区,适合视频帧存储和同步。
- 支持动态帧大小和分辨率调整。
- 同步机制:
- Genlock 同步:支持主从同步,确保多通道或多设备视频流对齐。
- 帧同步:支持外部帧同步信号或内部时钟同步。
- 中断支持:
- 提供 MM2S 和 S2MM 通道的中断信号,支持帧完成、错误等事件。
- 可选功能:
- 分散/聚集(Scatter/Gather):通过描述符链表管理非连续内存传输。
- 动态分辨率支持:允许运行时更改视频分辨率。
- 数据重排引擎(DRE):支持非对齐内存访问。
- 设备支持:
- 兼容 Artix-7、Kintex-7、Virtex-7、Zynq-7000、UltraScale、UltraScale+ 等。
- 设计工具:
- 支持 Vivado Design Suite 和 ISE Design Suite。
- 性能:
- 支持高带宽视频(如 1080p60、4K@30Hz)。
- 低延迟设计,适合实时视频处理。
应用场景
-
视频处理流水线:
- 在视频采集、处理和显示系统中,将视频数据从内存传输到视频处理模块(如缩放器、颜色转换器),或将处理后的视频数据写入内存。
- 常用于视频监控、医疗影像处理、工业视觉系统。
-
嵌入式视频系统:
- 在 Zynq-7000 或 Zynq UltraScale+ MPSoC 平台上,管理视频数据流,支持 HDMI、DisplayPort 或 SDI 输出。
- 适用于数字标牌、机顶盒、嵌入式多媒体设备。
-
实时视频传输:
- 在低延迟场景(如无人机视频传输、汽车辅助驾驶系统)中,传输实时视频流到内存或显示设备。
- 支持动态分辨率调整,适应不同视频源。
-
广播和专业视频设备:
- 用于视频切换器、广播编码器或专业视听系统,支持高分辨率视频(如 4K)帧缓冲和同步。
- 通过 Genlock 同步支持多通道视频流对齐。
-
硬件验证与测试:
- 在视频系统开发中,结合测试图案生成器(TPG)和视频时序控制器(VTC),验证视频处理模块的性能和兼容性。
- 适用于 FPGA 原型设计和硬件在环(HIL)测试。
-
多视频流处理:
- 在多路视频处理系统中(如视频墙、监控中心),管理多个视频流的内存访问和帧缓冲。
- 支持多端口内存控制器(MPMC)与 AXI Interconnect 结合。
使用指南
设计流程
-
IP 配置:
- 在 Vivado IP Integrator 中添加 AXI VDMA IP 核。
- 配置通道(MM2S、S2MM 或两者)、数据宽度(根据视频格式,如 RGB 24 位)、帧缓冲区数量(1-32)。
- 启用可选功能(如分散/聚集、Genlock 同步、DRE)。
- 设置 AXI4-Lite 地址范围和中断支持。
- 配置帧大小和行跨距(Stride),以匹配视频分辨率。
-
视频流水线集成:
- MM2S 通道:连接到 AXI4-Stream 视频外设(如 AXI4-Stream to Video Out、颜色转换器)。
- S2MM 通道:连接到视频输入模块(如 Video In to AXI4-Stream)。
- 内存接口:通过 AXI4 主接口连接到内存控制器(如 MIG DDR3/4)。
- 搭配 VTC IP 提供时序信号(如 Vsync、Hsync)。
-
时钟管理:
- 使用时钟向导(Clocking Wizard)生成像素时钟、AXI4-Lite 时钟和 AXI4 主接口时钟。
- 确保 MM2S 和 S2MM 通道的时钟频率支持目标视频带宽(如 1080p60 需要约 150 MHz)。
- 注意时钟域隔离,MM2S 和 S2MM 可使用不同时钟。
-
控制与软件开发:
- 通过 AXI4-Lite 接口使用处理器(如 Zynq PS 或 MicroBlaze)配置 VDMA(帧地址、分辨率、同步模式)。
- 使用 Xilinx 提供的 VDMA 驱动程序(位于 Vitis 嵌入式软件库)简化开发。
- 参考驱动示例(如 xaxidma_example_sg_poll.c)实现 DMA 传输控制。
-
验证与调试:
- 使用 Vivado 仿真工具验证 AXI4-Stream 和 AXI4 主接口信号(TValid、TReady、ARADDR 等)。
- 检查状态寄存器(如帧完成、错误状态)以诊断问题。
- 使用 Vivado ILA 监控硬件中的 DMA 传输和中断信号。
示例设计
以下是一个典型的视频处理设计:
- 模块:
- TPG IP 生成 AXI4-Stream 视频流(1080p60,RGB)。
- AXI VDMA(S2MM)将 TPG 输出写入 DDR3 内存。
- AXI VDMA(MM2S)从 DDR3 读取视频数据,输出到 AXI4-Stream to Video Out。
- VTC IP 提供时序信号,HDMI TX 输出到显示器。
- 控制:
- Zynq PS 通过 AXI4-Lite 配置 VDMA(帧地址、分辨率)和 TPG(图案类型)。
- 启用中断以监控帧传输完成。
- 时钟:
- 时钟向导生成 148.5 MHz 像素时钟、100 MHz AXI4-Lite 时钟和 200 MHz AXI4 主接口时钟。
- 参考:XAPP1218 提供了基于 Kintex-7 KC705 的 AXI VDMA 参考设计。
使用注意事项
-
带宽与时钟配置:
- 确保 AXI4 主接口和内存控制器的带宽支持目标视频分辨率和帧率。例如,4K@30Hz 需要高带宽 DDR 内存。
- 配置足够的时钟频率(如 200 MHz 用于 AXI4 主接口)以避免瓶颈。
-
帧缓冲区管理:
- 配置足够的帧缓冲区(建议 3-32 个)以支持平滑的视频流传输,避免帧丢失。
- 确保帧地址连续或使用分散/聚集模式处理非连续内存。
-
同步机制:
- 使用 Genlock 同步(主模式或从模式)确保 MM2S 和 S2MM 通道的帧对齐,特别是在多通道设计中。
- 验证外部帧同步信号(若使用)的稳定性和时序。
-
AXI4-Stream 协议合规性:
- 确保 AXI4-Stream 输入/输出信号(TValid、TReady、TData、TUser、TLast)符合协议要求。
- 若下游模块不支持 TUser 信号,使用 AXI4-Stream Subset Converter IP 进行转换。
-
中断与错误处理:
- 启用中断以监控帧完成、DMA 错误或同步失败。
- 检查状态寄存器(如错误代码)以诊断传输问题。
-
分散/聚集模式:
-
资源与性能优化:
-
仿真与验证:
- 在设计初期进行充分仿真,验证 AXI4-Stream 和 AXI4 主接口的信号时序。
- 使用 Vivado ILA 或外部逻辑分析仪监控硬件中的 DMA 传输。
-
与内存控制器兼容性:
常见问题与解决方法
-
问题:DMA 传输未启动(TValid 信号低)。
- 原因:帧地址未正确配置,或 TReady 信号未置位。
- 解决:检查 AXI4-Lite 寄存器配置,确保下游模块正确处理 TReady。
-
问题:视频流中断或帧丢失。
- 原因:内存带宽不足或帧缓冲区溢出。
- 解决:增加帧缓冲区数量,优化内存控制器带宽,或降低帧率。
-
问题:Genlock 同步失败。
- 原因:主从模式配置错误,或外部同步信号不稳定。
- 解决:验证 Genlock 配置,检查外部信号的时序和稳定性。
-
问题:高分辨率视频性能不足。
结论
Xilinx AXI Video Direct Memory Access IP (PG020) 是一个高效的视频 DMA 模块,支持在内存与 AXI4-Stream 视频外设之间的高带宽数据传输。其支持多帧缓冲、Genlock 同步和动态分辨率调整,适用于视频处理流水线、嵌入式系统和专业视频设备。使用时需特别注意带宽配置、帧缓冲管理、同步机制和 AXI4-Stream 协议合规性,以确保系统性能和稳定性。结合 Xilinx 提供的驱动程序和参考设计(如 XAPP1218),可加速视频系统开发。
设计工具推荐
- SZ901:
SZ901 是一款基于XVC协议的FPGA网络下载器。- 最高支持53M
- 支持4路JTAG独立使用
- 支持端口合并
- 支持国产FLASH烧写
- 下载器无限扩展
- 配备专属程序固化软件,一键烧写,能大大减小程序固化时间!