
生产故障
文章平均质量分 93
kcp606
https://www.kuangcp.top
展开
-
生产事故:因随意使用 Stream.parallel() 引发P1事故(PS:还很难排查)
那为什么并行流结合SQL查询就会有这个问题呢?这就要了解Stream并行流的设计实现了,简单来说背后是Fork/Join线程池实现并行。详细可参考java8 stream运行原理之并行流原理详解_stream的并行流-优快云博客。原创 2025-03-18 18:30:59 · 788 阅读 · 0 评论 -
解决 clickhouse jdbc 偶现 failed to respond 问题
解决 ClickHouseUnknownException: ClickHouse exception, code: 1002, failed to respond原创 2024-06-04 22:53:28 · 2005 阅读 · 0 评论 -
生产事故:线程管理不善诱发P0故障
其实前面铺垫了1.3.6版本的选择,只能说生不逢时了,因为那会这个项目还是处于孵化状态,后几年才正式发布。现在最新的版本大部分基础技术模块都重写或优化了,包括线程和线程池管理,用Micrometer埋点,加入了更细致的技术指标的监控和告警。但是从这个平台运行到现在已经有大量的调度在跑,要迁移的话就不是一个P0能扛得住了😇,这下有点船大难调头的意味了,只能在现有的架构上打补丁或者说打地鼠 DDDD。原创 2024-04-13 17:43:35 · 744 阅读 · 0 评论