15 DPDK 探索 什么是SR-IOV?

15 DPDK 探索 什么是SR-IOV?

SR-IOV全称single root input/output virtualization,直译过来就是单根I/O虚拟化,怎么理解呢?首先SR-IOV最初的应用(也是我仅知的应用)是在网卡上,下图是一张SR-IOV示意图,单根的“根”即图片最底层的物理网卡,SR-IOV起到的作用是把一张物理网卡虚拟化成多个虚拟网卡给虚拟机(VM)用。

跳过产生背景、原理、优劣,我们先直接看实现。

在这里插入图片描述

实现SR-IOV(顺便实现一下Netronome智能网卡的OVS卸载功能)

硬件条件
  • 一台支持SR-IOV的主机或服务器(主板),SR-IOV功能在BIOS中已开启; 我的就是台普通的DELL Optiplex7070主机,BIOS一开始都没动,好在虚拟化功能都是默认开启或者之前已经有人开启过的

  • 一块支持SR-IOV且能安装于上述设备的网卡; 我的是Netronome CX 25Gx2的智能网卡(奢侈)

关于如何查看主机/服务器对SR-IOV的支持:

查起来太费劲,不如直接到BIOS里面看一看有没有这个选项,像Intel的就在BIOS中的Advanced->CPU Setup界面下,有Intel Virtual TechnologyVT-d Feature选项,都设置为Enabled就好。AMD则是叫AMD-Vi。而且一般来讲,支持的话都会默认打开吧,至少我的是默认打开的。

网卡的产品介绍一般都会提到对SR-IOV的支持,这个查一查就好。

不满足以上硬件条件的话就别跟着做了。

系统和准备工作

我是基于Ubuntu 20.04.4,其他系统应该也没什么大碍,最好是Linux就是了。

在继续之前把系统intel_iommu打开:

先查看/proc/cmdline中是否有intel_iommu=on字样

$ cat /proc/cmdline

如果没有,修改/etc/default/grub文件,在其中的GRUB_CMDLINE_LINUX="",改为GRUB_CMDLINE_LINUX="intel_iommmu=on"(里面已有参数的话,多个参数用空格隔开),并执行sudo update-grub使修改生效(没有该命令的话是缺少软件包,执行:sudo apt-get install grub2-common),之后重启系统,再次查看iommu是否重新开启。使用dmesg | grep -e DMAR -e IOMMU以查看启动过程中与iommu有关的信息。

此外还需要安装虚机,我使用的是KVM,后续修改SR-IOV用的图形界面。其他的应该也支持SR-IOV吧。

Netronome网卡顺便一做的事(其他网卡就不用参考这条了)

其实我的初衷只是想做好Netronome网卡卸载OVS的实验,SR-IOV才是顺便一学的事情。

为了让Netronome网卡卸载OVS,需要更换网卡固件为flower,具体操作为:

$ cd /lib/firmware/netronome
$ rm -f *.nffw
$ for firmware in $(ls flower); do ln -sf flower/$firmware $firmware; done

还写了一个sh脚本,切换起来方便:

#!/bin/bash
​
# Usage: ./switch_firmware [bpf/flower/nic]
​
FIRMNAME=$1
​
pushd /lib/firmware/netronome
rm -f *.nffw
for firmware in $(ls $FIRMNAME); do ln -sf $FIRMNAME/$firmware $firmware; done
echo "Firmware re linked. Removing nfp mod..."
modprobe -r nfp
echo "nfp mod removed. Reloading nfp mod..."
modprobe nfp
echo "Firmware updated to $FIRMNAME."

这里我有一个BUG,一台主机切换flower固件后,lspci、ip link等都无法看到网卡,另一台机子就没问题。dmesg查看启动信息发现返回错误码(忘了多少了,后面补上)。

开始使用SR-IOV

我们把SR-IOV创建出的虚拟网卡称为VF,如下命令可以查看网卡物理端口enp3s0np0(称PF)最大支持创建的VF为55个;

$ cat /sys/class/net/enp3s0np0/device/sriov_totalvfs

创建VF也很简单,直接写入文件就行,比如分配2个VF给enp3s0np0

$ echo 2 > /sys/class/net/enp3s0np0/device/sriov_numvfs

这时lspci | grep Ethernet就能看到新添加的VF,以下设备中00:1f.603:00.0为物理网卡,03:08.003:08.1为新创建的VF虚拟网卡。此外使用ip linkifconfig等命令也可以看到新创建的VF信息,使用ethtool命令可以看到对应的driver为nfp_netvf

00:1f.6 Ethernet controller: Intel Corporation Ethernet Connection (5) I219-LM
03:00.0 Ethernet controller: Netronome Systems, Inc. Device 4000
03:08.0 Ethernet controller: Netronome Systems, Inc. Device 6003
03:08.1 Ethernet controller: Netronome Systems, Inc. Device 6003

这里ifconfig会发现多了四个接口:enp3s0v0enp3s0v1eth2eth4(创建VF前我也不知道哪多出来一个eth3)。03:08.0enp3s0v0eth2是对应的,剩下三个也是对应的,当03:08.0与某个虚机绑定后,enp3s0v0在host主机中消失,eth2还留着,官网没有详细解释,这部分还有点乱,希望以后能搞清楚怎么回事。

然后我们就可以把创建的VF与VM绑定了,这里我采用的是KVM的图形化管理器,因为懒得敲代码。

完成以后,VM就像有了自己的网卡,像是把物理网卡的端口拆成了几小份,分给每个VM使用。

不过从一开始的图片可以看出来,此时VM还是无法与同Host其他主机和外部主机通信的,我们还缺少一个Vitual Switch或者叫网桥,这里我们使用OVS,避免复杂,我们直接用Ubuntu的apt进行安装:

$ sudo apt update
$ sudo apt install -y openvswitch-switch

Netronome部分内容,其他网卡略过:

为了卸载OVS的kernel datapath,我们还需要使能OVS的硬件卸载模式,并重启OVS服务以生效:

$ ovs-vsctl set Open_vSwitch . other_config:hw-offload=true other_config:tc-policy=none
$ systemctl restart openvswitch-switch
12

此外网卡也要确认TC卸载标志位hw-tc-offload是否为on,flower固件默认是开启的。

$ ethtool -k enp3s0np0 | grep hw-tc-offloadhw-tc-offload: on

若非on可以:

$ ethtool -K enp3s0np0 hw-tc-offload on

创建网桥
$ ovs-vsctl add-br br0$ ovs-vsctl add-port br0 enp3s0np0$ ovs-vsctl add-port br0 eth2

这时外部主机和VM就可以互相通信了,VM用着同一块网卡的硬件资源,虚拟出自己的网卡,做到节省Host主机资源、提高性能等。

可惜的是我的Host主机太拉胯,开两个SR-IOV的虚机就死机,导致没做成SR-IOV的VM-VM实验。


Netronome部分内容,其他网卡略过:

OVS卸载相较于原始方案,区别就在于Netronome可以将Kernel中OVS的Fast path卸载到智能网卡,让原本由Kernel处理的流转移到硬件处理,进一步释放主机资源并提高性能。

使用如下命令即可查看已被卸载到网卡的流表:

# 查看卸载的流表
$ ovs-appctl dpctl/dump-flows type=offloaded# 查看未被卸载的流表$ ovs-appctl dpctl/dump-flows type=ovs

在华为ENSP仿真平台中配置和使用SR-IOVDPDK涉及多个层面的技术集成,包括虚拟化支持、硬件加速以及高性能数据包处理框架的应用。以下是关于如何在该环境中实现这些技术的具体说明: ### SR-IOV 的基本概念和支持条件 SR-IOV(Single Root I/O Virtualization)是一种用于提高网络性能的硬件虚拟化技术,允许物理网卡被划分为多个虚拟功能(VF),从而让每个虚拟机能够直接访问专属的 VF 而无需通过主机 CPU 进行转发[^1]。 为了在 ENSP 中模拟 SR-IOV 配置环境,需注意以下几点: - **设备兼容性**:确认所使用的虚拟化平台或仿真实验中的设备模型是否支持 SR-IOV 功能。 - **驱动程序安装**:确保操作系统已加载适合的 SR-IOV 驱动程序并启用相关模块。 ```bash # 查看当前系统是否启用了 SR-IOV 支持 lspci | grep -i ethernet # 启用指定 PCI 设备上的 VFs 数量 (假设 PF 对应 ID 为 0000:08:00.0) echo 4 > /sys/class/net/eth0/device/sriov_numvfs ``` ### DPDK 技术概述及其部署流程 DPDK(Data Plane Development Kit)提供了一套库函数集合来优化 Linux 用户空间下的高速报文处理能力。它绕过了传统内核协议栈以减少延迟并提升吞吐率[^2]。 要在 ENSP 上运行基于 DPDK 的应用,则需要完成如下准备工作: #### 安装依赖项 ```bash sudo apt-get update && sudo apt-get install -y build-essential gcc make libnuma-dev python3-pip pip3 install meson ninja ``` #### 编译构建 DPDK 库文件 下载最新版本源码后按照官方文档指示执行编译命令序列即可得到目标产物。 ```makefile meson setup builddir --prefix=/usr/local/ ninja -C builddir all ninja -C builddir install ldconfig ``` #### 绑定 NIC 至 UIO 或 VFIO 模型下管理 利用 dpdk-devbind.py 工具重新分配选定端口至用户态控制平面之下运作。 ```bash ./usertools/dpdk-devbind.py --status modprobe uio; modprobe igb_uio insmod ./kernel/linux/igb/igb_uio.ko ./usertools/dpdk-devbind.py --bind=igb_uio <BDF> ``` ### 结合 SR-IOVDPDK 实现方案 当上述两项独立组件均已妥善布置完毕之后便可着手考虑它们之间的协作方式了。一种常见做法便是借助于 OVS-DPDK 并开启其内部对于 SR-IOV 的原生支撑特性来进行联合调试验证工作流设计思路。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值