别怀疑硬件了,交换机性能瓶颈往往是这几个原因

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部


去年一家客户说核心交换机“带不动”了,业务卡顿,非要升级到高端型号。

我上去一看,CPU持续90%,内存占用85%,看着确实紧张。可流量统计显示,整机利用率不到30%。

一查进程,L2INF(二层协议处理)占了60%的CPU——原来是某接入层交换机的端口环路,导致BPDU和MAC漂移风暴不断上送主控。

清掉异常会话,CPU瞬间降到20%。干了这么多年,我明白一个道理:设备不会无缘无故“老”,它喊累,是因为有人在“滥用”

今天,我就把华为交换机性能排查的“三板斧”——CPU、内存、流量,给你拆开讲透。


今日文章阅读福利:华为交换机开局配置一本通 》

顺手发个好东西!网工必备资料!!

私信我,发送暗号“一本通”,即可获取这份优质PDF资源


01 性能瓶颈的三大来源

在排查前,先明确性能问题的可能根源:

关键原则:不能孤立看单一指标,必须三者联动分析


02 第一步:CPU使用率分析——谁在“吃”CPU?

01 查看整体CPU占用

# 查看1分钟、5分钟、15分钟平均负载
display cpu-usage

# 输出示例:
# CPU Usage Stat. Cycle: 10 (Second)
# cpu (s)  user      system   idle      
#         14%       23%      63%       
# CPU utilization for ten seconds: 37%

判断标准

  • < 50%:正常
  • 50%~70%:关注
  • 70%:需排查

02 定位高占用进程

# 查看各进程CPU占用
display cpu-usage process

# 输出示例:
# Process name &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; CPU%
# L2INF &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;62.1
# ARPSNOOPING &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;15.3
# OSPF &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 2.1

常见高危进程

  • L2INF:二层协议处理(STP、MAC学习)——查环路、BPDU风暴
  • ARPSNOOPING:ARP处理——查ARP泛洪、扫描
  • ACL:ACL匹配复杂——查规则数量与匹配频率

03 应对策略

  • L2INF过高 → 检查STP拓扑、启用BPDU保护
  • ARPSNOOPING过高 → 启用ARP限速、DAI
  • ACL过高 → 优化ACL规则顺序,减少通配符匹配

03 第二步:内存使用分析

01 查看内存总体占用

# 查看内存使用率
display memory-usage

# 输出示例:
# Memory Usage : 85%
# Total: 4194304 KB, Used: 3565158 KB, Free: 629146 KB

注意:华为设备内存包含主控和业务板,需分板查看。

02 检查关键资源表项

# 查看MAC地址表使用率
display mac-address summary
# Total: 16384, Used: 15800 → 占用96%,接近溢出

# 查看ARP表项
display arp all | count
# 若ARP表接近设备规格(如S5735支持16K ARP),需排查扫描行为

# 查看ACL资源占用
display acl resource

风险点:表项溢出会导致学习失败,引发通信异常。

03 内存优化建议

  • 合理设置MAC地址老化时间:mac-address aging-time 300
  • 启用ARP严格学习:arp learning strict
  • 定期清理无用静态表项

04 第三步:流量分析——是真忙还是“假象”?

01 查看接口流量趋势

# 查看接口带宽利用率
display interface brief

# 重点关注:
# - Input/Output rate(最近300秒平均流量)
# - CRC errors、giants(异常包)

判断标准:持续 > 70% 利用率需关注,> 90% 可能成为瓶颈。

02 识别异常流量类型

# 查看接口流量统计(按协议)
display interface gigabitethernet 1/0/1 | include broadcast|multicast

# 输出示例:
# &nbsp; &nbsp;Broadcast: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 123456 packets
# &nbsp; &nbsp;Multicast: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 789012 packets

异常信号

  • 广播包 > 10% 总流量 → 可能存在环路或扫描
  • 组播风暴 → 检查IGMP Snooping配置

03 使用NetStream进行深度分析(高端设备)

# 开启NetStream统计
interface gigabitethernet 1/0/1
&nbsp;ip netstream inbound
#
netstream exporter ip 10.1.1.100 2055
netstream sampler random-packets 1000

价值:可分析流量五元组,定位“元凶”IP与应用。


05 综合排查流程图

开始
&nbsp; ↓
查看 CPU 使用率 > 70%?
&nbsp; ↓ 是
查看高占用进程 → 定位协议类型
&nbsp; ↓
结合内存与流量验证:
- 内存是否高?表项是否溢出?
- 流量是否异常?广播比例如何?
&nbsp; ↓
制定策略:
- 优化配置(如STP、ACL)
- 阻断异常源(如私接设备)
- 升级硬件(最后选择)
&nbsp; ↓
结束


06 结语

交换机性能瓶颈的排查是一项系统性工作,需综合CPU、内存与流量三维度数据进行交叉分析。

华为设备提供了丰富的诊断命令,帮助咱定位问题根源。

实践中,多数性能问题源于配置不当或网络异常(如环路、扫描),而非硬件性能不足。

建议大家建立定期健康检查机制,通过display cpu-usage、display memory-usage和display interface等命令提前发现隐患,避免故障扩大。


整理:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值