一、背景:宿舍整层都掉线,但设备都“亮着正常”
在学校机房巡检时,宿管突然找到我们:
“整层宿舍从下午开始频繁掉线,网是亮的,但一直转圈连不上。”
这种情况非常典型。
当:
• 指示灯亮
• 能获取 IP
• 但无法上网
• 整层都受影响
十有八九是——二层环路。
我立刻赶到现场排查。
二、第一步:排除运营商与上游问题
我先从常规方向验证:
✔ PON 光衰正常
无断纤、无弱光。
✔ 核心交换机正常
CPU 正常、内存稳定、无风暴告警(当时还没有到风暴阈值)。
✔ DHCP 正常
IP 地址分配无异常。
上游完全没有问题。
问题一定出在宿舍这层的二层网络。
三、第二步:查看宿舍楼层交换机端口状态
我登录楼层交换机,发现一个非常明显的异常:
• 某宿舍端口出现端口状态频繁 Up/Down
• 广播帧、未知单播帧异常升高
• MAC 地址表在多个端口之间来回跳
这些现象都指向一个结论:
宿舍某个房间形成了环路。
四、第三步:实际排查宿舍房间
我们根据交换机端口定位到具体房间,敲门后看到这样一幕:
• 宿舍同学把一个便宜路由器当作交换机用
• WAN/LAN 全乱插
• 还多接了一个网线到另一个寝室
• 造成 LAN ↔ LAN ↔ 上联口 形成环路
这等于是:
一个宿舍触发全层网络瘫痪。
这种情况在校园运维里极其常见。
五、第四步:阻断环路 + 恢复网络
① 断开违规路由器
立刻阻断环路源头。
② 清理交换机 MAC 表
解除由于环路造成的异常 MAC 学习。
③ 观察端口
广播帧从几万级暴跌至正常值。
④ 网络恢复
不到 30 秒,全楼层恢复正常上网。
六、为什么环路会让整层掉线?(用最简单的语言讲清楚)
二层网络不支持“路由”,一旦形成环路后:
• 广播帧会无数次复制
• MAC 表快速抖动
• 交换机 CPU 被打满
• DHCP 包无法到达
• 整层网络宕机
整个过程不超过 3 秒。
这就是“广播风暴”。
七、这个案例给我带来的三项核心成长
① 第一次真正理解 STP/BPDU 在真实场景的价值
在课程上,我们只是“学过 STP”。
但在宿舍,这次事件让我明白:
• 没有 STP 的网络是极度危险的
• STP 能第一时间阻断环路
• BPDU 保护可以防止私接设备引发事故
也因此,我后来在校园机房主动建议开启:
• BPDU Guard
• Loop Guard
• Port Security
把风险扼杀在源头。
② 学会通过端口行为判断问题方向
端口 Up/Down 抖动
广播帧激增
MAC 地址在两个端口之间跳动
这些信息让我学会:
“交换机会告诉你它看到的真相。”
比问用户、比猜测都更准确。
③ 学会用最短时间完成排障闭环
这次故障我完成了完整流程:
• 发现问题
• 定位端口
• 实地确认
• 处理违规设备
• 清理 MAC 表
• 验证恢复
整个过程不到 10 分钟。
这就是作为运维人的成就感。
八、总结:宿舍网络是最能锻炼排障能力的地方
通过这次事件我真正理解:
• 真实网络比教材更复杂
• 二层环路是最常见但最危险的问题
• 运维必须学会从端口数据中“看懂线索”
• 经验和直觉来自一次次实战
也正是在这种校园实践中,我的排障速度、判断能力和网络理解能力得到了飞跃提升。
16万+

被折叠的 条评论
为什么被折叠?



