记一次服务器出现大量close_wait和last_ack

文章讲述了在将产品设备从华为云迁移到阿里云时遇到的close_wait和last_ack问题,经过排查,发现问题在于架构中的5M带宽VPNa和缺乏DB中间件冗余,解决策略是增加内网DB中间件并优化网络带宽。

这一次的close_wait和last_ack与内核参数无关。

背景:
    我们有华为云和阿里云两套生产环境。产品设备连接在华为云server,数量在数十万量级。
    现在需要将产品设备迁移至阿里云server,问题出现在:只要流量切换到阿里云,随着时间增长服务器就会出现大量close_wait和last_ack。
![在这里插入图片描述](https://img-blog.csdnimg.cn/fd410592b0624cd4968f934ea7a0ea51.png)
    并且随着时间增长,close_wait越来越多,没有下降的趋势。

接下来就是喜闻乐见的排错过程了:
    一、代码问题:两个环境部署的是同一套代码,可以排除。
    二、产品设备问题:服务端出现close_wait,根据TCP四次挥手流程(图放后面),是客户端主动断开了连接。但是设备连接华为云没问题,并且日志正常,可以排除。
    三、环境问题:网上查阅资料,发现close_wait与内核参数有关,于是将阿里云的内核参数配置成华为云相同,问题依然存在。
    四、数据库问题:数据库表现一切正常。
    五、网络问题:询问了阿里云客服,没有出现过网络波动,排除服务端网络问题。(这个地方埋了一个巨坑)。设备的网络,根据检测,信号也非常稳定。
    综合以上,发现都没问题,这不可能!绝对不可能!由于刚到这家公司不久,于是和人重新梳理整个架构,终于发现了问题所在。

TCP建立与断开过程图:

服务架构图:

  

    可以看到架构图中有个打通阿里云和华为云内网的VPN,然而这个VPN带宽只有5M。
    OK!排查网络问题中的巨坑找到了。
    这个地方有两个瓶颈,一个是VPN带宽影响了数据传输速度,一个是DB中间件没有冗余,任何一个出问题都会导致系统瘫痪。这两个都是亟需解决的问题。

    当然,这里先解决眼前出现的close_wait的问题。在阿里云内网搭建DB中间件,再观察服务器表现,问题解决!    

### TCP 连接状态转换的原因分析 当服务器上的某个连接经历从 `ESTABLISHED` 到 `CLOSE_WAIT`,再到 `LAST_ACK` 并最终到达 `CLOSED` 的过程时,这通常表明客户端主动关闭了该连接,而服务器端未能及时响应或处理这一事件。以下是每种状态的具体含义及其可能引发此序列的原因: #### 1. **ESTABLISHED** 这是正常的双向通信阶段,在这个状态下,双方都可以发送数据。 #### 2. **CLOSE_WAIT** 进入 `CLOSE_WAIT` 表明远程主机已经发出了 FIN 数据包来请求终止连接,但是本地应用程序尚未调用 close() 函数以释放资源。这意味着服务器程序可能存在逻辑错误或者性能瓶颈,未正确处理来自客户端的断开信号[^3]。 ```bash netstat -an | grep CLOSE_WAIT ``` 上述命令可以帮助识别处于这种状态下的连接数量。 #### 3. **LAST_ACK** 在此阶段,本机已回应了一个 FIN 包给对方,并等待最后一个 ACK 来确认整个会话结束。如果发现大量此类状态,则可能是由于网络延迟或是某些实现细节导致超时设置不合理所致[^4]。 #### 4. **CLOSED** 一旦收到最后那个ACK之后,就正式进入了closed状态表示这条链路已经被完全拆除不再存在任何活动流量。 --- ### 解决方案建议 针对以上提到的各种潜在问题可以采取如下措施加以改善: - 定期检查服务端应用层代码是否存在遗漏close操作的情况; - 增加日志录以便于追踪哪些具体情况下会产生过多的close_wait实例; - 对长时间保持在last_ack中的链接考虑适当调整tcp_fin_timeout参数值; 可以通过修改Linux系统的内核参数优化TCP行为模式比如减少TIME-WAIT队列长度等做法缓解压力. ```bash echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout ``` 上面的例子展示了如何降低默认fin timeout时间至更短周期从而加速清理processes lingering too long within last ack phase.[^5] --- ### 结论 综上所述,通过合理配置操作系统层面的相关选项以及改进软件设计缺陷能够有效防止不必要的资源消耗并提升整体效率表现。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值