Infiniband的驱动安装与配置

本文提供了一套从安装驱动到配置InfiniBand (IB) 的详细步骤,包括驱动安装、IPoIB配置等内容,适合新手快速上手。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

网上虽然有许多IB的教程但是大多数比较乱,这里结合自己的实际使用整理了下从安装驱动到配置的过程。

驱动安装

1.从官网上找到适合自己硬件的驱动:
http://www.mellanox.com/page/software_overview_ib

文末选择自己的OS环境

文末勾选I Have Read the Above End User License Agreement.
点击接受获得下载链接。

2.以用户名root登录系统安装驱动
检查主机是否安装了HCA:

lspci -v | grep Mellanox

挂载MLNX_OFED镜像

mount -o ro,loop MLNX_OFED_LINUX-2.1-1.0.0-rhel6.4-x86_64.iso /mnt

在/mnt目录下执行如下命令:

./mlnxofedinstall

ps.
1.如果最后显示Failed to update Firmware.是不影响正常使用的。
2.安装过程中不要断网,不然有可能会出错。

会报一堆依赖缺少,安装工具会提醒你用yum install指令,直接复制粘贴搞定。

sudo yum intstall 缺少的部分

3.启动openibd并设为开机启动:

service openibd start
chkconfig openibd on

5.启动子网管理器opensmd并设为开机启动:

service opensmd start
chkconfig opensmd on

6.查看HCA端口状态,若State为Active,则表示正常。

ibstat

7.还可以用如下命令查看HCA端口:

hca_self_test.ofed

8.重启系统

reboot

用如下命令卸载驱动:

/usr/sbin/ofed_uninstall.sh

IPoIB配置

1.查看HCA端口状态,若State为Active,则表示正常,方可继续执行后面的步骤。

ibstat

2.创建文件/etc/sysconfig/network-scripts/ifcfg-ib0,文件内容如下:

DEVICE=ib0
BOOTPROTO=static
IPADDR=10.0.0.5
NETMASK=255.255.255.0
BROADCAST=10.0.0.255
NETWORK=10.0.0.0
ONBOOT=yes

3.重启网络接口ib0

ifdown ib0
ifup ib0

4.查看ib0的网络配置

ifconfig ib0

5.在两台机器上按如上步骤配置后(不同机器只需更改IPADDR的值即可),可以使用命令ping测试配置是否成功。

6.实际的使用方式和IPv4基本没有区别,如果想要集群之间通过IB通信只需要用IPoIB的地址就行。
e.g.

ssh 10.0.0.5

参考链接:
http://www.xuebuyuan.com/2068505.html
http://www.ithao123.cn/content-8676305.html

### CentOS 上安装 InfiniBand (IB) 网卡驱动方法 #### 1. 检查硬件和操作系统兼容性 在开始之前,确认系统的硬件设备是否支持 InfiniBand 并验证其当前运行的操作系统版本之间的兼容性。可以使用 `lspci` 命令来检测 IB 网卡的存在情况[^3]。 ```bash lspci | grep Mell ``` 如果命令返回类似于以下的结果,则表明系统已成功识别到 Mellanox 的 InfiniBand 控制器: ``` 5e:00.0 Infiniband controller: Mellanox Technologies MT27800 Family [ConnectX-5] 5e:00.1 Infiniband controller: Mellanox Technologies MT27800 Family [ConnectX-5] ``` #### 2. 下载并解压驱动程序包 前往 Mellanox 官方网站下载适用于目标操作系统的最新驱动程序包。对于 CentOS 7.x 版本,推荐使用 MLNX_OFED(Mellanox OpenFabrics Enterprise Distribution)软件套件[^4]。 执行如下命令完成必要的准备工作: ```bash wget https://www.mellanox.com/downloads/ofed/MLNX_OFED-<version>.rpm.bundle tar zxvf MLNX_OFED-<version>.rpm.bundle cd MLNX_OFED-<version> ``` #### 3. 执行驱动安装脚本 通过运行安装脚本来部署 InfiniBand 驱动及相关工具链。默认情况下会自动检测环境需求并进行配置调整。 ```bash ./mlnxofedinstall --add-kernel-support ``` 注意:当遇到内核版本不匹配等问题时,可能需要重新编译对应的支持模块或者升级至更高版本的内核以获得更好的稳定性和支持特性。 #### 4. 加载驱动模块 一旦安装过程结束,需确保相关驱动已被正确加载入内存中。利用 `lsmod` 和 `modprobe` 工具可实现这一目的。 查询指定驱动状态: ```bash lsmod | grep ib_ ``` 尝试手动加载未激活的组件(如必要): ```bash modprobe ib_uverbs modprobe iw_cm ``` #### 5. 测试网络连接功能 最后一步是对新安装好的 InfiniBand 接口做基本的功能测试,比如 ping 或者带宽测量等简单任务。这有助于判断整个设置流程是否顺利完成以及性能表现如何。 ```bash ibstat ping -I <interface_name> <remote_node_address> iperf -c <server_ip> -B <local_bind_address> ``` 以上就是在 CentOS 中针对 InfiniBand HCA 设备实施驱动装载的具体指导方案[^1][^2][^3]。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值