情况:测试节点没问题,一样的代码发到生产就会启动卡住,并且在自动监控下不断重启并且每次都卡住。
原因:生产的网络环境复杂,启动耗时很长(比如70s),但是k8s配置的启动监控时间短(比如40s),它40s的时候监测到服务还没启动成功,就会认为服务启动失败(其实还在正常启动中),会重启服务,陷入死循环。
解决:调整这个服务的服务检测时间。
博客讨论了在Kubernetes(K8s)环境中,服务在生产环境因启动耗时过长导致的自动重启问题。问题源于生产网络环境复杂,启动时间超出K8s的健康检查时间限制。解决办法是调整服务的健康检查超时设置,确保其大于实际启动所需时间,从而避免服务的无限重启循环。
情况:测试节点没问题,一样的代码发到生产就会启动卡住,并且在自动监控下不断重启并且每次都卡住。
原因:生产的网络环境复杂,启动耗时很长(比如70s),但是k8s配置的启动监控时间短(比如40s),它40s的时候监测到服务还没启动成功,就会认为服务启动失败(其实还在正常启动中),会重启服务,陷入死循环。
解决:调整这个服务的服务检测时间。
3886
2795
6734
2934

被折叠的 条评论
为什么被折叠?