作者:闫兴安
1 vxlan隧道问题定位
本文描述某OpenStack测试环境vxlan隧道数目错误问题的原因定位及解决办法。
1.1 环境信息
| 节点类型 |
|
| 控制节点(起dhcp-agent) |
3 |
| 网络节点(起vRouter) |
2 |
| 计算节点(ovs-agent) |
70 |
该环境曾经有73个计算节点,删除了3个计算节点。
1.2 问题现象
确认各分组数目:
| Salt 配置文件中指定vxlannode分组为: vxlannode: N@controller or N@network or N@compute
需要建立隧道的节点数目 salt -N vxlannode cmd.run "ovs-vsctl show |grep vxlan |grep Port|wc -l" |grep scq |wc -l 应该是75个。
节点的隧道数目: salt -N controller cmd.run "ovs-vsctl show |grep vxlan |grep Port|wc -l" |grep scq |wc -l 应该是3个。
salt -N network cmd.run "ovs-vsctl show |grep vxlan |grep Port|wc -l" |grep scq |wc -l 应该是2个。
salt -N compute cmd.run "ovs-vsctl show |grep vxlan |grep Port|wc -l" |grep scq |wc -l 应该是70个。 |
查看各节点的vxlan隧道数目。
| salt -N controller cmd.run "ovs-vsctl show |grep remote|wc -l" salt -N network cmd.run "ovs-vsctl show |grep remote |wc -l" salt -N compute cmd.run "ovs-vsctl show |grep remote |wc -l" salt -N vxlannode cmd.run "ovs-vsctl show |grep remote |wc -l" |
看到有些节点是70个隧道,有些是78个隧道(未贴图)。

本文详细描述了一次OpenStack环境下vxlan隧道数量异常的问题定位与解决过程。作者通过检查环境信息、问题现象,分析日志、代码流程,发现错误隧道的多种原因,如节点变化、DB信息不准确等。最终,提出了手动恢复方法,包括DB修正和重启ovs-agent,以及对代码修改的探讨。
最低0.47元/天 解锁文章
3198

被折叠的 条评论
为什么被折叠?



