RDMA
文章平均质量分 54
tiantianuser
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
RDMA设计27:队列管理模块设计之完成模块详细分析
本文介绍了RoCE v2协议中完成队列的设计思路。采用虚拟完成队列结构,简化了数据处理流程,避免了队列阻塞问题,同时减少了存储资源开销。异常处理单元能及时反馈错误信息并触发重传机制。该设计已在B站展示性能演示视频,适用于NVME或RDMA项目需求。更多技术细节可参考博客中的系列文章或联系作者获取商用方案。原创 2025-12-31 14:13:10 · 610 阅读 · 0 评论 -
RDMA设计26:队列管理模块设计之接收队列模块详细分析
本文分享了网络通信设计中接收队列的实现思路,重点介绍了接收队列管理单元的结构与功能。接收队列表单与发送队列表单一一对应,通过队列ID匹配实现RoCEv2队列对的完整性管理。相比发送队列,接收队列采用直接通知DMA控制器的设计,减少了存储资源占用,提高了处理效率。作者提醒本文仅为设计思路交流,商用IP设计需更多参考。相关内容已在博客发布150多篇,并可通过B站视频进一步了解性能表现(搜索用户:专注与守望)。原创 2025-12-31 14:09:50 · 138 阅读 · 0 评论 -
RDMA设计25:队列管理模块设计之发送模块详细分析
本文介绍了发送队列管理的设计思路,重点阐述了发送队列管理单元和存储的实现方式。发送队列采用共享存储空间,支持BRAM/URAM/LUTRAM等实现方案。管理单元通过SQ1表单和用户SQ表单动态管理队列信息,包括ID、深度、会话参数等关键字段。系统支持队列的创建、删除和读写操作,能实时校验请求合法性并动态分配存储地址。这种设计允许用户灵活配置队列参数,优化系统性能和功耗。相关实现细节和性能数据可通过文末B站链接进一步了解。原创 2025-12-30 11:39:01 · 390 阅读 · 0 评论 -
RDMA设计24:队列管理模块设计
本文介绍了队列管理模块的设计思路,采用管理与存储分离的结构,包含发送队列存储、发送队列管理、接收队列管理等多个子模块。详细说明了发送流程、接收与完成流程以及异常处理机制的工作原理。该设计已在博客发布150多篇相关文章,并提供了B站视频链接供进一步了解性能表现。作者强调本文仅作参考,不可直接用于商用IP设计,若有NVME或RDMA项目需求需另行联系。原创 2025-12-30 11:35:16 · 525 阅读 · 0 评论 -
RDMA设计23:连接管理模块设计3
本文分享了RoCE v2协议中连接断开流程的状态机设计思路。文章详细描述了从DISCONNECT状态开始的五个处理阶段:会话ID验证、请求包发送、等待回复、处理请求和发送响应。会话管理池设计深度为64,满足常见应用需求。作者强调本文仅为技术交流,不能直接用于商用IP设计,并提供了B站视频链接供进一步了解性能表现。相关设计思路已在博客发布150多篇,旨在为初学者提供参考。原创 2025-12-30 11:22:50 · 182 阅读 · 0 评论 -
RDMA设计22:连接管理模块设计2
摘要:本文分享了RoCE v2协议建立连接的状态机流程设计,包括CONNECT、CON_SEND_REQ、CON_WAIT_REP和CON_SEND_RTU四个关键状态。作者提醒该设计仅供初学者参考,不适用于商用IP开发。对NVMe或RDMA项目有需求的读者可通过B站视频(用户:专注与守望)获取更多性能数据后联系咨询。文中包含状态转换示意图和超链接供进一步了解。原创 2025-12-29 10:50:55 · 151 阅读 · 0 评论 -
RDMA设计21:连接管理模块设计
本文介绍了连接管理模块的设计思路,该模块由连接信息缓存、状态机和会话管理池组成。状态机在IDLE状态下检测缓存指令,分别执行类似TCP三次握手的连接建立流程或四次挥手的断开流程。文中提供了状态转移图,并建议参考B站视频获取更多性能细节。作者强调这些内容仅为设计参考,不能直接用于商用IP开发。原创 2025-12-29 10:48:46 · 346 阅读 · 0 评论 -
RDMA设计20:RoCE v2 发送及接收模块设计2
本文介绍了RoCE v2发送模块的设计思路,该模块通过请求状态机和应答状态机分别控制数据包生成流程。请求状态机包含IDLE、SEND、READ、WRITE_HEAD、WRITE_DATA和DONE六个状态,根据不同请求类型(SEND/READ/WRITE)执行相应操作,并与DMA控制器交互完成数据传输。模块采用双状态机架构提高系统效率和降低延迟,由多个生成单元、MUX和异常处理单元组成。文中提供了状态转移图和详细的状态说明,并指出这只是设计参考,不能直接用于商用IP设计。原创 2025-12-17 09:52:03 · 999 阅读 · 0 评论 -
RDMA设计19:RoCE v2 发送及接收模块设计
本文介绍了RoCE v2协议的发送接收模块设计,该模块由SEND、READ、WRITE、ACK和REP五个单元组成,分别处理不同类型的请求和回复包。其中SEND单元用于主机间参数交换,WRITE单元通过DMA控制器实现高效数据传输。作者强调本文仅提供设计思路参考,实际商用IP设计需更多考量,并推荐通过B站视频了解详细性能表现。相关技术资料已在博客发布约150篇,适合初学者参考学习。原创 2025-12-17 09:45:43 · 739 阅读 · 0 评论 -
RDMA设计18:队列管理模块设计3
本文介绍了RoCE v2协议中完成队列的设计思路,采用虚拟完成队列结构简化处理流程。完成条目解析单元通过单时钟周期处理实现高效解析,异常处理单元负责错误检测与响应。设计优化了存储资源利用,降低了用户操作复杂度。文末提供B站视频链接供进一步了解性能细节,并提示商用IP设计需专业支持。原创 2025-12-16 11:37:43 · 269 阅读 · 0 评论 -
RDMA设计17:队列管理模块设计2
本文分享了RoCEv2接收队列的设计思路,指出接收队列由管理单元构成,包含RQ1表单和用户接收队列表单,并与发送队列表单一一对应。接收队列管理单元通过队列ID匹配表单,通知发送队列释放条目,由DMA直接处理数据,节省存储资源并提高效率。作者提醒这些思路仅供参考,商用设计需更多考量,并提供了B站视频链接供进一步了解性能详情。原创 2025-12-16 11:35:27 · 200 阅读 · 0 评论 -
RDMA设计16:队列管理模块设计1
本文介绍了一种队列管理模块的设计方案,采用管理与存储分离的结构,包含发送/接收队列管理、完成条目处理等功能单元。重点阐述了发送队列的实现机制:使用共享存储空间配合管理单元,通过动态表单管理队列ID、会话信息等参数,支持队列的创建、删除及请求处理。该系统支持BRAM/URAM/LUTRAM多种存储实现,允许运行时动态调整队列深度和数量以适应不同场景需求。文末提供了B站视频链接以供进一步了解性能表现。该设计适用于NVMe/RDMA相关项目开发。原创 2025-12-16 11:30:41 · 556 阅读 · 0 评论 -
RDMA设计15:连接管理模块设计2
本文介绍了RoCEv2协议中建立和断开连接的状态机流程。在建立连接时,系统会检查会话ID是否存在,依次发送连接请求、等待回复和就绪包。断开连接流程类似,需要验证会话ID后发送断链请求并处理回复。会话管理池深度设为64,可满足常见应用需求。作者提供了B站视频链接供进一步了解性能详情。文中强调这些内容仅供学习参考,不能直接用于商用IP设计。原创 2025-12-15 09:46:40 · 409 阅读 · 0 评论 -
NVMe-oF 国产IP设计:网络存储解决方案
摘要:基于NVMe和RDMA开发经验,推出国产化NVMe-oF IP解决方案。该IP充分发挥PCIe4.0接口性能,实测单条三星980Pro读写速度突破6GBps。系统架构优化带来显著性能优势,详情可通过视频链接了解(https://space.bilibili.com/585132944)。原创 2025-12-15 09:39:02 · 540 阅读 · 0 评论 -
RDMA设计14:连接管理模块设计
连接管理状态机状态转移图如图 1 所示。在 IDLE 状态下,如果检测到连接信息缓存非空,表明有新的连接指令需要处理。状态机判断指令类型,如果为创建连接则跳转至 CONNECT 状态,创建连接流程类似 TCP/IP 三次握手流程;当连接信息缓存为空时,状态机保持在 IDLE 状态。连接管理模块由一个连接信息缓存、一个连接管理状态机和一个会话管理池组成。连接信息缓存中存放由系统控制模块写入的待处理连接指令信息;连接管理状态机获取连接指令信息,并进行连接建立或连接断开流程;图1 建链/断链状态转移图。原创 2025-12-04 10:36:19 · 653 阅读 · 0 评论 -
RDMA设计13:融合以太网协议栈设计2
本文介绍了RoCE v2高速数据传输系统的模块化设计方案。系统包含连接管理、队列管理、发送/接收、ICRC校验、拥塞控制和DMA控制器六大模块。连接管理采用CM API协议简化建链流程;队列管理实现动态配置优化性能;发送/接收模块负责协议包转换与DMA交互;ICRC模块保障数据完整性;拥塞管理采用DCQCN算法;DMA控制器支持高效突发传输。该系统通过模块化设计实现高性能数据传输,适用于NVMe和RDMA等应用场景。详细技术说明和性能演示可参考作者B站视频。原创 2025-12-04 10:33:31 · 927 阅读 · 0 评论 -
RDMA设计12:融合以太网协议栈设计1
本文介绍了融合以太网协议栈在RoCE v2系统中的实现方案。该协议栈通过硬件逻辑实现RDMA数据包转换、队列管理及指令提交机制,包含连接管理、队列管理、发送/接收模块等六大功能模块。系统通过寄存器配置实现高速数据传输,降低延迟并提升寻址速度。作者在B站发布了相关性能演示视频,并提醒读者本文仅为设计思路交流,商用IP设计需进一步探讨。完整方案及NVME/RDMA项目需求可联系作者获取更多信息。原创 2025-12-02 09:29:11 · 362 阅读 · 0 评论 -
RDMA设计11:性能监测单元设计
本文介绍了RoCE v2高速数据传输系统中的性能监测单元设计,该单元负责监控SEND/READ/WRITE等指令的提交、完成状态及延迟信息,并将数据存储在特定寄存器组中。作者提供了相关寄存器组定义表格,并指出该内容仅为设计思路分享,强调不可直接用于商用IP开发。对于NVME或RDMA产品需求,建议观看B站视频(附链接)后联系咨询。文中还提到博客已发布百余篇相关技术文章,可供初学者参考学习。原创 2025-12-02 09:26:10 · 377 阅读 · 0 评论 -
RDMA设计10:指令控制单元设计
本文介绍了指令控制单元的设计思路,该单元通过寄存器组简化DMA操作控制。指令控制寄存器组包含操作码、地址、密钥等寄存器,定义数据传输参数;指令状态寄存器反馈操作状态和错误代码。文章提供了寄存器详细定义表格,并指出该设计仅为参考,实际商用需进一步开发。相关性能演示视频可在B站搜索"专注与守望"获取。本文适合初学者了解基本设计概念。原创 2025-12-02 09:23:37 · 171 阅读 · 0 评论 -
RDMA设计9:队列控制单元设计
摘要:本文介绍了RDMA队列控制单元的设计原理,该单元通过队列控制寄存器组(包含IP、MAC地址等信息)和队列操作状态寄存器实现队列的创建、删除及连接管理功能。文章强调该内容仅供学习参考,商用设计需进一步咨询,并提供了B站视频链接(BV1mPV5eCE8z)展示相关性能演示。完整设计思路详见作者130余篇博客文章。原创 2025-12-01 09:22:36 · 250 阅读 · 0 评论 -
RDMA设计8:状态管理单元设计
本文分享了设计思路交流,提供了一百多篇相关博文供初学者参考,但强调这些内容不能替代商用IP设计。文章重点介绍了状态管理单元的功能,包括读取物理链路和队列连接状态,并详细说明了状态管理寄存器组的定义(如表1所示)。其中物理链路状态寄存器、速率寄存器以及队列连接状态/类型寄存器分别反映了系统连接状态、握手速率和主机连接情况(最大支持8台主机)。如需了解NVME或RDMA产品需求,可观看B站相关性能视频(搜索用户"专注与守望")。原创 2025-12-01 09:18:18 · 305 阅读 · 0 评论 -
NVMe高速传输之摆脱XDMA设计69:心得
本文分享了69篇NVMe IP及40余篇相关博文的设计经验,主要介绍:(1)NVMe固态硬盘在数据采样前端的可行性分析及FPGA设计需求;(2)PCIe、NVMe、AXI协议关键技术解析;(3)NVMe高速传输架构设计,包含控制、初始化、NVMe控制、PCIe加速等模块实现;(4)UVM验证平台搭建及功能验证方法。作者在B站分享了性能演示视频,更多详情可搜索用户"专注与守望"查看。本系列文章旨在为初学者提供设计参考,但需注意不可直接用于商用IP开发。原创 2025-10-31 08:14:22 · 771 阅读 · 0 评论 -
RDMA设计7:系统控制模块设计
摘要:本文介绍了RoCE v2高速数据传输系统中的核心控制模块设计。该模块包含状态管理、队列控制、指令控制和性能监测四大单元,通过AXI-Lite总线接口实现用户交互。系统采用寄存器组方式简化控制流程,支持DMA等功能管理,并提供链路状态监控。文章强调该内容仅为技术参考,商用IP设计需专业支持,并提供了相关视频资源链接。原创 2025-11-19 11:32:37 · 572 阅读 · 0 评论 -
RDMA设计6:IP架构2
本文介绍了高性能RoCE v2存储传输系统的核心模块架构,重点阐述了融合以太网协议栈、以太网协议栈和CMAC集成块三大功能模块。其中,融合以太网协议栈实现RoCE v2指令转换和队列管理功能;以太网协议栈负责网络包解析/封装及流量控制;CMAC集成块则提供物理层连接支持。文章强调该系统已在实际项目中验证性能,并建议读者参考B站相关视频获取更详细信息。所有技术内容仅作为学习参考,商用设计需进一步专业支持。原创 2025-11-19 11:29:24 · 491 阅读 · 0 评论 -
RDMA设计5:IP架构
本文介绍了基于RoCE v2技术的高速数据传输IP设计,重点阐述了系统架构和功能模块。系统通过QSFP28、AXI-Lite和AXI4接口实现数据传输与控制,内部包含系统控制、协议栈等核心模块。系统控制模块集成了RDMA建链、队列管理等功能,通过AXI-Lite接口简化用户集成。作者强调本文仅为技术参考,商用设计需进一步了解,并提供了B站视频作为补充说明。文章附带系统架构图和视频链接,供读者深入学习。原创 2025-11-18 08:18:05 · 624 阅读 · 0 评论 -
RDMA设计4:技术需求分析2
摘要:本文介绍了一种基于FPGA的RoCE v2 IP设计方案,支持IBTA 1.5协议规范,采用Xilinx CMAC集成块和独立UDP/IP协议栈。该设计特点包括纯逻辑电路开发、AXI总线接口、多队列并行管理以及DMA传输功能,支持最高8个QP和8192总队列深度。设计方案已通过B站视频展示性能表现,适用于高速数据传输应用场景。原创 2025-11-18 08:10:20 · 180 阅读 · 0 评论 -
RDMA设计3:技术需求分析1
摘要:本文提出一种基于FPGA的RDMA IP设计方案,适用于高速射频信号数据采集场景。该设计采用纯逻辑电路实现,具备通用性(支持多型号FPGA和独立运行)、高性能(支持256MB连续数据90Gbps传输、4KB包10μs延迟)和易集成等特点,可满足复杂数据环境下的多路传输需求。设计包含完备的队列管理及拥塞处理功能,支持QSFP28光纤接口,并提供标准化接口和DMA功能。相关性能视频已在B站发布。原创 2025-11-18 08:05:09 · 263 阅读 · 0 评论 -
RDMA设计2:开发必要性之性能简介
本文分享高性能RDMA存储与传输技术研究,展示优化后的IP设计性能指标与资源占用情况(附测试数据图)。作者已发布100多篇RDMA相关博文供初学者参考,但强调不可直接用于商用设计。如需NVMe/RDMA产品或项目合作,可观看B站视频("专注与守望"账号)后联系。文中提供了三组关键性能数据图表,并附B站视频链接供详细了解技术细节。原创 2025-11-17 08:27:19 · 172 阅读 · 0 评论 -
RDMA设计1:开发必要性1之设计考虑
远程直接内存访问技术(RDMA) 是一种专为远距离网络通信设计的技术, 其通常通过光纤进行设备间连接, 提供高通量、 低延迟、 远距离的零拷⻉网络数据传输。因此, 该协议是数据采集系统拓展传输方式的最佳选择, 适应 FPGA 应用的的 RDMAover RoCE v2 IP 可以确保以上场景下发挥出最优性能。为了满足大批量数据的采集、 存储与传输需求, 如机器学习、 雷达、 ⾦融⻛控、 航空航天等, 如何在 FPGA 上实现高带宽、 低延时的数据传输以解决 FPGA 系统存储容量不足已成为亟待解决的问题。原创 2025-11-17 08:18:25 · 776 阅读 · 0 评论 -
RDMA简介5之RoCE v2队列
摘要:RoCE v2协议通过工作队列(WQ)和完成队列(CQ)实现数据传输控制,其中工作队列分为发送队列(SQ)和接收队列(RQ),二者组成队列对(QP)。数据传输时,应用程序提交工作请求(WR)生成WQE,网卡处理后产生CQE。五种操作类型中,RECEIVE仅作用于接收队列,而READ、WRITE、ATOMIC为单边操作。RoCE v2队列包括五种状态(RESET、INIT、RTR、RTS、ERROR),由状态机控制切换,决定队列的数据收发能力。不同状态下队列可执行的操作权限各异,ERROR状态表示队列失原创 2025-06-05 17:16:07 · 848 阅读 · 0 评论 -
RDMA简介之4ROCE V2初析
RDMA原语分为单边和双边语义,单边操作(READ/WRITE/ATOMIC)无需远程CPU参与,提供高吞吐和低延迟;双边操作(SEND/RECEIVE)需双方CPU协作,保证可靠性但性能较低。单边语义通过地址和密钥访问远程内存,原子操作确保数据一致性。双边语义用于信息交换和错误处理,需发送和接收缓冲区匹配。原创 2025-06-05 15:28:24 · 554 阅读 · 0 评论 -
RDMA over RoCE V2设计2:系统框架设计考虑
本文介绍了一个基于RoCE v2协议的高性能FPGA数据传输IP设计。该设计采用Xilinx CMAC集成块开发独立UDP/IP协议栈,支持纯逻辑电路运行和AXI总线接口。系统架构包含控制模块、融合以太网协议栈、以太网协议栈和CMAC集成块,实现RDMA建链、队列管理、DMA传输等功能,支持网络包封装解析和流量控制。该设计具有高传输性能和低资源占用特点,已在B站展示相关性能。原创 2025-07-15 09:09:31 · 1045 阅读 · 0 评论 -
RDMA over RoCE V2设计1:通用,稳定及高性能!
本文探讨了基于FPGA的RDMA over RoCEv2设计要点。RDMA技术通过直接内存访问优化分布式数据传输效率,RoCEv2因其高性价比成为主流实现方式。设计需考虑四大关键因素:通用性(支持多型号FPGA、纯逻辑实现)、高性能(满足90Gbps传输速率和低延迟要求)、易集成性(标准化接口和DMA功能)以及稳定性(高速接口匹配、时序优化和存储资源合理分配)。文章还展示了IP核读写性能数据,并提供了B站视频链接供进一步了解。该设计针对国产化需求,在FPGA间实现高性能RDMA通信方面具有竞争优势。原创 2025-07-15 08:56:01 · 740 阅读 · 0 评论 -
RDMA简介9之AXI 总线协议分析2
AXI4总线通道结构解析:采用读写分离、数据与控制分离的设计,包含五个通道(写地址、写数据、写响应、读地址、读数据),实现多主多从连接与并行处理。写通道包含独立响应反馈,读响应则与数据合并返回。这种架构显著提升了数据吞吐量。(图1为通道结构示意图,相关视频可访问B站链接或搜索用户名"专注与守望")原创 2025-06-24 13:50:19 · 239 阅读 · 0 评论 -
RDMA简介8之AXI 总线协议分析1
AXI总线是由ARM公司推出的高速片内互连协议,包含AXI4、AXI4-Lite和AXI4-Stream三种接口类型。AXI4支持高性能传输特性如乱序和突发传输;AXI4-Lite简化了功能,适用于简单单次通信;AXI4-Stream专为点对点数据流设计,无地址总线。三种接口各有特点,满足不同的片内互连需求。表1详细对比了它们的特性差异。原创 2025-06-24 13:44:29 · 876 阅读 · 0 评论 -
RDMA简介7之RoCE v2可靠传输
摘要:RoCEv2协议通过丢包重传机制(采用后退N帧算法)、流量控制(PFC算法)和拥塞管理(DCQCN算法)实现可靠传输。其中PSN编号检测丢包,PFC通过8个虚拟通道进行优先级流控,而DCQCN则利用ECN标记实现拥塞控制。这些技术共同保障了RoCEv2在无损网络中的高效传输。(149字)原创 2025-06-13 09:01:53 · 1700 阅读 · 0 评论 -
RDMA简介6之RoCE v2连接管理
RoCEv2协议提供两种队列工作模式:有连接模式(支持可靠RC和不可靠UC传输)和无连接模式(仅支持UD传输)。有连接模式要求队列对严格绑定通信,而无连接模式允许任意队列对间通信。连接建立可通过CMAPI(基于UD报文交换QP信息)或SocketAPI(需先建立TCP/IP连接)两种方式实现,涉及缓冲区、MTU等参数协商。两种模式在通信机制上存在显著差异。原创 2025-06-13 08:44:23 · 502 阅读 · 0 评论 -
RDMA简介3之四种子协议对比
RDMA协议包含四种实现方式:InfiniBand、RoCE(v1/v2)和iWARP。InfiniBand采用专用网络架构,性能最优但成本高昂;RoCE协议通过以太网承载IB协议,其中v1仅支持二层网络,v2基于UDP/IP可支持三层网络;iWARP基于TCP/IP实现,兼容性最好但资源消耗较大。从应用趋势看,兼顾成本与性能的RoCE v2正成为数据中心的主流选择。各协议在网络层级、硬件需求和部署成本方面存在显著差异。原创 2025-06-04 15:54:26 · 769 阅读 · 0 评论 -
RDMA简介1之RDMA开发必要性
摘要:FPGA作为数据采集前端面临存储容量不足的挑战,DDR SDRAM已无法满足TB级数据存储需求。研究表明,结合RDMA技术可实现高带宽、低延时数据传输,其中RoCE v2协议因以太网兼容性和低成本成为理想选择。当前研究聚焦于FPGA实现RoCE v2协议控制,并需解决不同数据采集场景下的性能优化问题。(148字)原创 2025-06-03 14:37:10 · 521 阅读 · 0 评论
分享