号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部
去年一家客户说核心交换机“带不动”了,业务卡顿,非要升级到高端型号。
我上去一看,CPU持续90%,内存占用85%,看着确实紧张。可流量统计显示,整机利用率不到30%。
一查进程,L2INF(二层协议处理)占了60%的CPU——原来是某接入层交换机的端口环路,导致BPDU和MAC漂移风暴不断上送主控。
清掉异常会话,CPU瞬间降到20%。干了这么多年,我明白一个道理:设备不会无缘无故“老”,它喊累,是因为有人在“滥用”。
今天,我就把华为交换机性能排查的“三板斧”——CPU、内存、流量,给你拆开讲透。
今日文章阅读福利:《华为交换机开局配置一本通 》
顺手发个好东西!网工必备资料!!

私信我,发送暗号“一本通”,即可获取这份优质PDF资源。
01 性能瓶颈的三大来源
在排查前,先明确性能问题的可能根源:

关键原则:不能孤立看单一指标,必须三者联动分析。
02 第一步:CPU使用率分析——谁在“吃”CPU?
01 查看整体CPU占用
# 查看1分钟、5分钟、15分钟平均负载
display cpu-usage
# 输出示例:
# CPU Usage Stat. Cycle: 10 (Second)
# cpu (s) user system idle
# 14% 23% 63%
# CPU utilization for ten seconds: 37%
判断标准:
- < 50%:正常
- 50%~70%:关注
70%:需排查
02 定位高占用进程
# 查看各进程CPU占用
display cpu-usage process
# 输出示例:
# Process name CPU%
# L2INF 62.1
# ARPSNOOPING 15.3
# OSPF 2.1
常见高危进程:
- L2INF:二层协议处理(STP、MAC学习)——查环路、BPDU风暴
- ARPSNOOPING:ARP处理——查ARP泛洪、扫描
- ACL:ACL匹配复杂——查规则数量与匹配频率
03 应对策略
- L2INF过高 → 检查STP拓扑、启用BPDU保护
- ARPSNOOPING过高 → 启用ARP限速、DAI
- ACL过高 → 优化ACL规则顺序,减少通配符匹配
03 第二步:内存使用分析
01 查看内存总体占用
# 查看内存使用率
display memory-usage
# 输出示例:
# Memory Usage : 85%
# Total: 4194304 KB, Used: 3565158 KB, Free: 629146 KB
注意:华为设备内存包含主控和业务板,需分板查看。
02 检查关键资源表项
# 查看MAC地址表使用率
display mac-address summary
# Total: 16384, Used: 15800 → 占用96%,接近溢出
# 查看ARP表项
display arp all | count
# 若ARP表接近设备规格(如S5735支持16K ARP),需排查扫描行为
# 查看ACL资源占用
display acl resource
风险点:表项溢出会导致学习失败,引发通信异常。
03 内存优化建议
- 合理设置MAC地址老化时间:mac-address aging-time 300
- 启用ARP严格学习:arp learning strict
- 定期清理无用静态表项
04 第三步:流量分析——是真忙还是“假象”?
01 查看接口流量趋势
# 查看接口带宽利用率
display interface brief
# 重点关注:
# - Input/Output rate(最近300秒平均流量)
# - CRC errors、giants(异常包)
判断标准:持续 > 70% 利用率需关注,> 90% 可能成为瓶颈。
02 识别异常流量类型
# 查看接口流量统计(按协议)
display interface gigabitethernet 1/0/1 | include broadcast|multicast
# 输出示例:
# Broadcast: 123456 packets
# Multicast: 789012 packets
异常信号:
- 广播包 > 10% 总流量 → 可能存在环路或扫描
- 组播风暴 → 检查IGMP Snooping配置
03 使用NetStream进行深度分析(高端设备)
# 开启NetStream统计
interface gigabitethernet 1/0/1
ip netstream inbound
#
netstream exporter ip 10.1.1.100 2055
netstream sampler random-packets 1000
价值:可分析流量五元组,定位“元凶”IP与应用。
05 综合排查流程图
开始
↓
查看 CPU 使用率 > 70%?
↓ 是
查看高占用进程 → 定位协议类型
↓
结合内存与流量验证:
- 内存是否高?表项是否溢出?
- 流量是否异常?广播比例如何?
↓
制定策略:
- 优化配置(如STP、ACL)
- 阻断异常源(如私接设备)
- 升级硬件(最后选择)
↓
结束
06 结语
交换机性能瓶颈的排查是一项系统性工作,需综合CPU、内存与流量三维度数据进行交叉分析。
华为设备提供了丰富的诊断命令,帮助咱定位问题根源。
实践中,多数性能问题源于配置不当或网络异常(如环路、扫描),而非硬件性能不足。
建议大家建立定期健康检查机制,通过display cpu-usage、display memory-usage和display interface等命令提前发现隐患,避免故障扩大。
整理:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部
1028

被折叠的 条评论
为什么被折叠?



