场景构造:
node1 (10 pods) → gate_way → node2
网关配置:
br-tun桥对应隧道,br-ext桥对应外部网络。

复现过程:
node1节点建10个pods,并行打流,通过tcpreplay方式,流量经过网关节点 直接到 node2 服务器
发送端提供了约400W pps的发包能力,此时后端实际收包约为200W 不到,和之前测的单卡场景相差约100W左右,性能大大降低。

问题分析:
- 热点函数分析:

通过perf
本文分析了一个Open vSwitch(OVS)双网卡场景中,流量从node1通过网关到node2时,性能下降的问题。通过函数热点分析,发现dp_packet_batch_clone函数CPU资源消耗异常。问题在于流量不仅转发到dpdk_external_port,还转发到br-ext口,导致额外的操作和性能损耗。解决方案包括修改xlate_normal_flood函数的逻辑或调整端口配置。在应用解决方案后,性能恢复正常。问题仅在OVS老化线程更新规则前出现,之后能自我修复。
场景构造:
node1 (10 pods) → gate_way → node2
网关配置:
br-tun桥对应隧道,br-ext桥对应外部网络。

复现过程:
node1节点建10个pods,并行打流,通过tcpreplay方式,流量经过网关节点 直接到 node2 服务器
发送端提供了约400W pps的发包能力,此时后端实际收包约为200W 不到,和之前测的单卡场景相差约100W左右,性能大大降低。

问题分析:

通过perf
3153

被折叠的 条评论
为什么被折叠?