记一次线上dubbo线程池爆满的问题 jedis 2.9源码问题

本文分析了一个二手房楼盘字典服务中出现的Dubbo服务故障,通过深入研究发现故障根源在于Redis连接池的连接泄漏问题。文章详细描述了故障现象、排查过程及解决方案,包括使用jstack和jmap工具进行现场保护,分析线程和内存状况,最终定位到jetcache使用的Jedis 2.9.0版本存在的连接泄漏bug,并提出了升级Jedis版本至2.10.2的修复方案。
服务项目背景:

一个二手房楼盘字典的服务,有三台服务,查询量大,用了redis缓存,用的缓存框架 jetcache,注解缓存
dubbo线程池配置 500个线程 dubbo.provider.threads=500

异常现象与初步分析

以为是底层服务,Cat疯狂告警,整个dashboard告警。dubbo 远程调用全部超时,查看poi.esf.fdd项目日志,只有一台机器dubbohandler线程一直处于爆满状态,其他两台偶有50-100ms的慢SQL
Cat上GC没有任何异常 初步认为是慢SQL导致,但是慢SQL也不是慢的离谱的

快速解决恢复
  • 保护现场
    dump 当前线程状况 jstack > xxxx.txt
    dump 当前内存 jmap -dump:live,format=b,file=xxx.hprof pid
    如果系统没有内存执行jmap,强制执行 jmap -dump:live,format=b,file=xxx.hprof -F pid

  • 恢复服务,因为没有服务器发布权限,kill -9 12 杀进程

分析日志

  1. grep -c ‘DubboServerHandler’ xxx.txt =====> 500
    grep -A 1 ‘DubboServerHandler’ xxx.txt =====> 所有的线程都是 waiting (parking),也就是被挂起的线程
  2. 接着看日志,发现堆栈信息中有redis相关的代码
    翻看源码,发现所有的waiting(parking)线程是在从redis连接池中获取,因为池中无可用的连接,所以等待队列AQS将线程parking住了
    堆栈日志
  3. 怀疑是线程获取到了redis连接,因为数据比较大,socket一直连接数据等待。
    jetcache的jedis pool配置:
    jetcache.remote.default.timeout=3000
    jetcache.remote.default.poolConfig.minIdle=5
    jetcache.remote.default.poolConfig.maxIdle=30
    jetcache.remote.default.poolConfig.maxTotal=500
    分析: 最大都有500个数据连接,也不至于500个连接全都不行,而且也设置了超时时间,这种情况也排除了(没有线上运维redis的权限,无法查看redis是否有慢查询)

4、换个思路
会不会是redis 连接池中的连接泄漏了,因为redis连接的回收都是框架回收的,有异常也是会catch回收的,看看了jetcache携带的jedis版本是2.9.0,github上对于这个问题已经在2.10.2版本进行了修复,就是连接泄漏了,没有回收给redispool,导致后面的线程都拿不到getresource (此时日志中应该也有 can not get redisresoure,设置的timeout稍微长了点,dubbo日志疯狂打,也没看到)

5、分析内存
内存分析

6、源码分析
jeidis 2.9
JedisSentinelPool.getResource()获取
jedis.close()
关闭归还

分析:
In the case of concurrency
Thread A return an object but not run to “this.dataSource = null” yet
Thread B borrow an object and set dataSource to this;
And Then Thread A run this.dataSource = null;
Finally Thread A will never returnResource because dataSource is null
简化版本: 线程A先将连接还给了连接池,最后对象置为null,如果在 A线程归还给线程池时,B线程瞬间获取到此连接,随后线程A将此连接置为null,就永远不会被回收给线程池

官方解读:

2.9官方问题讨论
2.10.2官方修订版

官方修订版

在这里插入图片描述

升级方案
<dependencies>
 <dependency>
 <groupId>redis.clients</groupId>
 <artifactId>jedis</artifactId>
 <version>2.10.2</version>
 </dependency>
 </dependencies>
### Dubbo 线程池配置参数说明 Dubbo 提供了多种线程池配置选项,允许开发者根据实际业务需求灵活调整线程池的行为。以下是主要的线程池配置参数及其作用: #### 1. **`threadpool`** `threadpool` 参数定义了服务端使用的线程池类型。常见的线程池类型有以下几种: - **`fixed`**: 固定大小的线程池,适用于稳定的高并发场景[^2]。 - 特点:线程数固定不变,适合处理大量短时间的任务。 - **`cached`**: 缓存型线程池,动态创建和销毁线程,适用于任务量波动较大的场景[^5]。 - 特点:能够快速扩展线程数量以适应突发流量,但在低负载时会回收多余线程。 - **`limited`**: 类似于 `fixed`,但增加了队列支持,防止过多请求阻塞线程池[^4]。 - **`eager`**: 默认情况下延迟加载线程,在启动阶段就初始化所有线程。 #### 2. **`threads`** `threads` 参数指定了线程池的最大线程数。其默认值通常为 200,但这可以根据具体的硬件资源和服务压力进行调整[^3]。 - 如果设置过小,则可能导致请求排队甚至超时;如果过大,则可能引发系统资源耗尽的风险。 #### 3. **`queues`** `queues` 参数控制等待队列的长度。对于某些类型的线程池(如 `fixed`),可以指定未被立即处理的请求所占用的队列容量[^4]。 - 合理增加队列长度有助于缓解瞬时高峰的压力,但也需要注意内存消耗以及潜在的饥饿问题。 --- ### 配置示例 以下是一个典型的 XML 配置实例,展示了如何通过 `<dubbo:protocol>` 标签完成线程池的相关设定: ```xml <dubbo:protocol name="dubbo" threadpool="fixed" threads="100" queues="100"/> ``` 而在基于 Spring Boot 的环境中,也可以通过 YAML 或 Properties 文件实现类似的配置: ```yaml spring: dubbo: protocol: threads: 2000 threadpool: cached dispatcher: message ``` --- ### 最佳实践 为了更好地利用 Dubbo线程池功能并提高系统的稳定性和性能,推荐遵循以下几点最佳实践: 1. **选择合适的线程池类型** 不同的应用场景对应不同的线程池模式。例如,在高频次的小规模事务中优先考虑 `fixed` 模式;而对于不可预测的工作负载可以选择更弹性的 `cached` 方案。 2. **合理规划线程数目与队列尺寸** 结合服务器 CPU 数目、可用内存等因素综合评估最优的 `threads` 和 `queues` 取值范围。过高或过低都会影响整体表现[^1]。 3. **实施全面监控机制** 利用 APM 工具或者自定义指标跟踪线程利用率、响应时间和错误率等关键数据项,及时发现瓶颈所在并作出相应改进措施[^1]。 4. **定期开展压测活动** 在正式部署前务必针对目标环境执行充分的压力测试,验证当前配置能否满足预期 QPS 要求的同时留有一定余量应对未来增长趋势。 5. **启用动态调节能力** 对生产环境下运行中的应用尝试引入自动伸缩特性,使得它能够在不重启的情况下实时修改核心参数从而迅速适应外部变化带来的挑战。 --- ### 示例代码片段 下面给出一段简单的 Java 实现代码,展示如何借助注解形式完成 Dubbo Service 定义及部分重要属性声明工作: ```java import org.apache.dubbo.config.annotation.DubboService; @DubboService( version = "1.0.0", ioThreads = Runtime.getRuntime().availableProcessors() + 1, executes = 50, // 单方法最大并发数设为50 accepts = 200 // 接受连接上限限定为200 ) public class MyServiceImpl implements MyService { @Override public String sayHello(String name) { return "Hello, " + name; } } ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值