作者:李鹏博
爱可生 DBA 团队成员,主要负责 MySQL 故障处理和 SQL 审核优化。对技术执着,为客户负责。
本文来源:原创投稿
*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。
最近客户的一台 MySQL Server 告警处于 TCP TIME_WAIT 状态的连接过多,通过查看相关监控发现 TCP Connections 中处于 TIME_WAIT 状态的连接一直在 3000~4000 ,如图:

在 OS 上查看 TCP 处于 TIME_WAIT 状态的连接:

(其中161服务器是本地的 MySQL Server ,4125是数据库端口,234是远程应用服务器)
可以看到所有处于 TIME_WAIT 状态的 TCP 连接都是应用服务器234到本地161的数据库连接,此时心中有一个疑问:只有主动关闭 TCP 连接的一端才会存在 TIME_WAIT 状态,主观的想法就是大量的 TIME_WAIT 应该位于应用服务器一端,哪为何 MySQL Server 这一端有这么多处于 TIME_WAIT 状态的 TCP 连接?难道是有大量由于 wait_timeout 超时的连接,所以 MySQL Server 这一端主动关闭了连接,还是由于网络异常或客户端异常关闭,导致 MySQL Server 一端主动关闭了连接,但是通过观察 MySQL Connections 相关监控发现连接数量一直都是比较少的:

本文探讨了MySQL服务器中TIME_WAIT状态连接过多的问题,通过系统调整、抓包分析和MySQL内部机制揭示了短连接引发的TCP状态。作者发现解决办法在于替换短连接为长连接,以减少服务器端TIME_WAIT状态的数量。
最低0.47元/天 解锁文章
1081

被折叠的 条评论
为什么被折叠?



