记 Spring Cloud 的首次请求卡住问题

最新推荐文章于 2024-10-14 11:51:52 发布

原创最新推荐文章于 2024-10-14 11:51:52 发布 · 1.8k 阅读

1 ·

CC 4.0 BY-SA版权

Spring Cloud 专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一个在SpringBoot应用中遇到的首次启动慢的问题，特别是在Centos环境下，某些接口首次请求时会卡住并出现Brokenpipe错误。通过调整Java的熵源设置，将默认的阻塞型熵源更换为非阻塞型，成功解决了这一问题。

首先这不是 Spring Cloud 的锅，只是我遇到时是在用 Spring Cloud。为了之后大家排查问题比较方便，我决定加上这个关键字。

解决方案

启动参数加上：-Djava.security.egd=file:/dev/./urandom

问题描述

在一个微服务启动之后，有些接口会在首次请求的时候卡住，需要三到四分钟才会返回，然后会有 Broken pipe 报错。调试发现，本机不会有这个问题，用 WSL的Ubuntu也不会有这个问题，只有在线下测试机器 Centos 上会有这个问题。然后发第二次以及之后的请求都不会有这个问题。
首先这是个非常严重的问题，问题不解决是意味着几个月的努力全部白费。甚至没有什么好的绕过去的办法，我不可能重启的时候先发一个请求，等几分钟恢复正常再切流量。
然后去百度了一下，有各种各样的超时案例，一开始没发现匹配的。依照经验，我用 jstack xxxx 把线程堆栈打出来，看一下线程都在做什么，但是经验不足，不知道怎么看。真的很尴尬，然后去几个 Spring Cloud 群问了一下，好像也没有人遇到这个问题，并且有解决方案。
最终强大的谷歌帮助我找到了前人的经验：Spring Boot应用首次启动慢的问题，完全一样的现象，写得也很详细。是熵源的问题：原来，Java随机数生成依赖熵源（Entropy Source），默认的阻塞型的 /dev/random熵源可能导致阻塞，而换一个非阻塞的 /dev/urandom 的熵源就可以了。(引自原文)，解决方案就是启动参数加上：-Djava.security.egd=file:/dev/./urandom
同时（敲黑板，重点！）：
- 看 jstack 堆栈 hang 住问题，优先看 RUNABLE ！
- 看 jstack 堆栈 hang 住问题，优先看 RUNABLE ！
- 看 jstack 堆栈 hang 住问题，优先看 RUNABLE ！
- 如果一开始我就看 RUNABLE，可能就没有这么折腾，这么靠运气，终究自己还是学艺不精，要好好修炼！