一文读懂RDMA、RoCE与NVMe-oF的奥秘

原创于 2025-05-08 09:27:57 发布 · 1k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#缓存 #科技 #大数据 #算法 #数据结构

一文读懂RDMA、RoCE与NVMe-oF的奥秘专栏收录该内容

2 篇文章

订阅专栏

RDMA（远程直接内存访问）

RDMA（Remote Direct Memory Access）诞生于高性能计算（HPC）领域，旨在解决传统TCP/IP网络协议栈的瓶颈。在传统网络中，数据需经过发送端CPU封装协议头、接收端CPU解析协议头，导致延迟高、CPU占用率高、带宽利用率低三大问题。RDMA通过绕过操作系统内核（Kernel Bypass）和零拷贝（Zero-Copy）机制，实现了两点间内存直接读写，彻底解放了CPU资源。

RDMA是一种网络协议，允许计算机通过网络直接读写另一台计算机的内存空间，无需对方CPU参与数据搬运，仅通过网卡（RNIC）完成数据传输。其核心标准由IBTA（InfiniBand Trade Association）制定，支持InfiniBand、RoCE、iWARP三种传输层协议。

核心原理与架构

（1）工作流程

建立连接：通过QP（Queue Pair，队列对）建立通信上下文，包括发送队列（SQ）和接收队列（RQ）。
内存注册：预先将目标内存区域注册为RDMA可访问区域，生成物理地址与密钥（Key）。
数据传输：发送端：应用直接向SQ提交工作请求（Work Request），包含操作类型（Send/Write/Read）和内存地址。接收端：网卡硬件解析请求，直接读写目标内存，完成后通过CQ（完成队列）通知应用。

（2）关键技术特性