## 记录一次生产环境接口超时排查问题
背景:今天上班搬砖时,用户反馈某个工厂的一个功能接口报错。
处理流程如下:
1、首先去kibana平台查看报错日志,日志显示接口调用超时。看到报错后首先去看了程序代码,最近没有人动过,因此排除业务代码的问题。
2、由于是超时原因,所以去跟程序看了执行的sql,发现都是毫秒级别的sql,也排除慢sql原因
3、由于是武汉的工厂反馈的问题,其他地区的工厂没有反馈异常(我们的系统是分布式),因此联想到了网络原因。跟武汉的网络工程师沟通后,发现网络是通的,所以我去看了应用的访问时间限制
配置如下:
client:
config:
default:
connectTimeout: 5_000
readTimeout: 5_000
发现仅配置了5秒之后,感觉大概率是这个原因(武汉工厂的网络到中心服务本来就比较慢),改大时间进行发布后问题解决。

本文记录了一次生产环境中接口超时问题的排查过程。通过分析日志、检查SQL执行效率及调整网络延时配置,最终定位并解决了问题。
1646

被折叠的 条评论
为什么被折叠?



