
在之前的记一次k8s pod频繁重启的优化之旅中分享过对于pod频繁重启的一些案例,最近又遇到一例,继续分享出来希望能给大家带来些许收获。
问题现象
报警群里突然显示某pod频繁重启,我随即上去查看日志,主要分这么几步:
1.查看pod重启的原因,kubectl descirbe pod
Last State: Terminated
Reason: Error
Exit Code: 137
上面的Reason:Error太宽泛了,不能直观的知道原因,Exit code:137一般表示程序被 SIGKILL 中断信号杀死,异常原因可能为:

https://cloud.tencent.com/document/product/457/42945
首先排除OOMKilled情况,剩余的就是livenessProbe(存活检查)失败。
2.查看pod事件,kubectl descirbe pod,重点关注输出的Events部分
Warning Unhealthy 2m56s (x8 over 7m16s) kubelet Liveness probe failed: Get http://10.244.11.136:8080/jc_actuator_1/health: net

本文分享了一次由于Full GC频繁触发导致Kubernetes Pod重启的案例。通过排查,发现是大量数据导出到Excel时引发的问题,包括无分页查询、Apache POI性能问题、导出无限流和同步导出。解决方案包括查询分页、更换性能更好的导出工具(如EasyExcel)以及实现异步导出,实施后有效减少了Full GC引发的Pod重启问题。
最低0.47元/天 解锁文章
2714

被折叠的 条评论
为什么被折叠?



