真正的网工,靠逻辑排障,50个网络故障排查与修复技巧

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部


前阵子一同事说:“服务器连不上,我重启了三次交换机!”我问:“查过ARP吗?看错包了吗?”

他摇头。我说:“你这是在碰运气。”

80%的网络故障,靠“ping + 重启”解决不了,必须分层定位、证据驱动

今天,我把压箱底的50个实战技巧,按OSI七层模型分类整理,从线缆到服务,一招一式教你精准“捉虫”。


今日文章阅读福利:网络排障好用工具合集

私信我,发送暗号“排障”,即可获取工具资源合集。

01 物理层(Layer 1)——“灯亮≠链路健康”

  1. 接口UP但丢包?查CRC错误

    display interface gigabitethernet 0/0/1

    → CRC > 0:光模块脏、光纤弯折、距离超限。

  2. 双工不匹配导致性能差
    → 一端强制100M全双工,另一端自协商 → 冲突增多。 ✅ 建议:两端统一设为auto或手动匹配。

  3. 网线只通4芯?测通断
    → 用测线仪查1-2-3-6是否导通(百兆只需4芯)。

  4. 光纤收发功率异常?查光衰

    display transceiver interface

    → 收光功率 < -23dBm → 链路不可靠。

  5. 设备频繁重启?查电源/风扇
    → display device 看电源状态、温度告警。


02 数据链路层(Layer 2)——“二层不通,三层白搭”

  1. 同一网段ping不通?查ARP表

    arp -a # Windows
    display arp | include 192.168.1.100

    → 无条目?终端没发ARP,或交换机没学MAC。

  2. MAC地址漂移?查环路

    display mac-address flapping record

    → 同一MAC在多个端口出现 → 二层环路。

  3. VLAN配错?查端口模式

    • 终端接Access口 → 必须配port default vlan X
    • 交换机互联 → 必须Trunk并放行VLAN
  4. STP阻塞端口?查拓扑

    display stp brief

    → 端口状态为DISCARDING?可能是生成树阻塞。

  5. 错包突增?查双工/速率/线缆
    → 半双工+全双工混用 → 冲突帧飙升。


03 网络层(Layer 3)——“路由决定路径”

  1. 跨网段ping不通?查网关
    → 终端网关是否配对?网关是否能ping通?

  2. tracert第一跳超时?网关问题
    → 网关防火墙拦ICMP,或接口DOWN。

  3. 路由表缺失?查直连/静态/动态

    display ip routing-table 192.168.30.0
  4. 默认路由指向错误?业务全断
    → 0.0.0.0/0 下一跳是否可达?

  5. IP冲突?查ARP/MAC
    → 同一IP对应两个MAC → 冲突。用arping探测。

  6. 子网掩码配错?部分通部分不通
    → 如192.168.1.10/24 访问 192.168.2.10/16 → 可能误判为同网段。


04 传输层(Layer 4)——“端口决定服务”

  1. telnet通但服务不可用?查应用层
    → 端口开≠服务正常(如Web配置错)。

  2. UDP端口无法用telnet测
    → 改用 nc -u -zv IP 端口 或抓包。

  3. 防火墙拦了特定端口?查ACL

    display acl 3000
  4. NAT转换失败?查会话表

    display firewall session table
  5. 端口被占用?查进程

    netstat -ano | findstr :80 # Windows
    ss -tuln | grep :80 # Linux

05 应用层(Layer 7)——“服务才是终点”

  1. HTTP 502?查后端服务
    → Nginx反向代理,后端宕机。

  2. DNS解析慢?查递归服务器
    → nslookup google.com 8.8.8.8 对比响应时间。

  3. HTTPS证书过期?浏览器报错
    → 用 openssl s_client -connect site:443 查证书有效期。

  4. 邮件发不出?查SMTP端口/认证
    → 25端口常被ISP封,改用465/587。


06 通用排障技巧(必背!)

  1. 先本地,后远程
    → 先ping 127.0.0.1 → 再ping本机IP → 再ping网关

  2. 先内网,后外网
    → 内网通,外网不通 → 问题在出口(NAT/防火墙)

  3. 先简单,后复杂
    → 换线、换口、换设备,快速隔离故障点

  4. 抓包是终极手段
    → Wireshark抓包,看SYN是否回ACK,DNS是否响应

  5. 对比法:正常 vs 异常
    → 同一网络下,A通B不通 → 差异在哪?

  6. 清计数再观察

    reset counters interface ge 0/0/1
  7. 查日志时间线

    display logbuffer | include Oct 10
  8. 不要忽略客户端防火墙
    → Windows Defender常拦入站连接

  9. DHCP获取失败?查地址池/租期
    → display dhcp server ip-in-use

  10. 无线连不上?查信道干扰/认证
    → 用WiFi分析仪看同频AP数量


07 华为/华三专属技巧

  1. 查看设备启动配置

    display startup
  2. 查设备CPU/内存

    display cpu-usage
    display memory-usage
  3. 查接口流量TOP

    display interface | include bps
  4. 查MAC地址对应端口

    display mac-address | include 00e0-fcxx-xxxx
  5. 查ARP对应接口

    display arp | include 192.168.1.100

08 安全与策略排查

  1. ACL顺序影响结果
    → 先deny后permit?规则顺序很重要!

  2. 安全策略未放行?查zone

    display security-policy rule all
  3. IP-MAC绑定导致断网
    → 用户换网卡,MAC变,被策略拦截

  4. 防ARP欺骗开启?误拦合法流量
    → 检查arp anti-attack配置


09 无线与特殊场景

  1. AP上线失败?查CAPWAP隧道
    → AC与AP间UDP 5246/5247是否通

  2. VLAN间路由不通?查VLANIF IP
    → 三层交换机必须配interface vlanif X

  3. OSPF邻居起不来?查区域/掩码/认证
    → display ospf peer 看状态

  4. BGP路由不学?查AS号/下一跳
    → display bgp routing-table

  5. QoS限速导致慢?查策略应用

    display qos policy interface
  6. 时间不同步?影响日志/证书/认证
    → 配NTP:ntp-service unicast-server 192.168.10.1


10 结语

这50个技巧,不是零散知识点,而是一套系统化排障方法论

记住:网络故障从不随机发生,它只是你没看到的证据链

下次再遇“不通”,别急着重启,按层排查,用命令说话,用数据定位。


整理:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值