在 InfiniBand (IB) 网络中,IB 交换机的 hostname 通常可以通过子网管理器 (Subnet Manager, SM) 进行管理和修改。这里涉及到的是 IB 交换机的 Node Description
字段,它通常用于标识设备的位置或用途,类似于以太网交换机的 hostname。
✅ 一、修改 IB 交换机 hostname (Node Description) 的方法
在 IB 网络中,hostname 实际上指的是 Node Description,可以通过 ibndctl
、smctl
或其他 IB 管理工具来修改。下面是修改流程:
1️⃣ 查看当前 IB 交换机的 Node Description
在主机 (通常是 Subnet Manager 运行的服务器) 上执行以下命令:
ibswitches
示例输出:
Switch 0x0020ef0200112345: MLNX-IB-SW1
Switch 0x0020ef0200116789: MLNX-IB-SW2
这里的 MLNX-IB-SW1
就是 Node Description。
2️⃣ 修改 IB 交换机的 Node Description
使用 ibndctl
来修改指定交换机的 Node Description:
ibndctl set-node-desc <GUID> "<New_Node_Description>"
例如:
ibndctl set-node-desc 0x0020ef0200112345 "IB-SW01-RACK-A"
✅ 注意:GUID 是交换机的全球唯一标识,可通过
ibswitches
获取。
3️⃣ 验证修改结果
确认修改后的描述是否生效:
ibswitches
或:
ibndctl show
✅ 二、修改 Node Description 对 IB 网络的影响
-
不影响 IB 网络数据流量
- 修改 Node Description 不会影响数据转发,因为 InfiniBand 使用 GUID 和 LID (Local Identifier) 进行路径解析,Node Description 仅是描述性字段,不参与实际数据包的转发。
-
可能触发部分 IB 网络重新扫描
- 如果你的 Subnet Manager (SM) 是动态管理的,某些操作可能会触发 IB 网络的 拓扑重新发现 (Topology Rescan),但这种行为不会中断网络,只是会产生轻微的管理延迟。
-
建议维护窗口执行
- 尽管不影响数据流量,推荐在业务低峰期执行修改,尤其是大规模 IB 网络环境下,避免拓扑更新带来潜在的路径计算压力。
✅ 三、其他注意事项
-
Subnet Manager (SM) 管理节点
- 确保修改是在 主 Subnet Manager (主控节点) 上执行,否则可能无法生效。
- 如果使用的是 Mellanox UFM,可通过 Web UI 直接修改。
-
多 SM 环境
- 如果有多个 Subnet Manager 处于主备状态 (如
opensm
+mlx-sm
),确保在主 SM 上修改,避免被其他 SM 覆盖。
- 如果有多个 Subnet Manager 处于主备状态 (如
-
批量修改
- 如果需要对多台交换机进行批量标注,可以结合
ibndctl
和for
循环批量执行。
- 如果需要对多台交换机进行批量标注,可以结合