druid连接超时时间20分钟引起的血案

本文分析了生产环境中定时任务处理大量业务数据时出现的挂批问题,探讨了Druid连接池配置对问题的影响,并提出了两种解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.问题描述

生产环境当数据量大的时候有时就会出现挂批问题。(默认3分钟定时任务调度一次,可是有时候定时任务启动了,但是业务数据没有处理)。挂批就造成大量业务挤压,没有处理。这时候就需要人手工处理。

2.问题分析

2.1 bug 反思路分析

JobDetail#execute
/**这段代码中首先判断一下批次的状态是否是running,若是running那么直接返回,不调用处理业务逻辑代码*/
if (RUNNING.equals(taskInfo.getStatus())) {
    logger.info(taskInfo.getId().getTaskKey() + "is running...");
} else {
    // 处理业务逻辑的代码
    execute(context, task, taskInfo);
    log.info("job exec end"+DataUtil.now())
    updateJobDb(task);
}

2.2Bug分析

强总提示druid配置发现一个 Druid连接池 removeAbandonedTimeout 设置1200。

配置说明:removeAbandonedTimeout 超过时间限制是否回收 。

根据强总得分析,紧接着我们分析一下源码。简单来说就是druid会hold住连接池。

com.alibaba.druid.pool.DruidDataSource#getConnectionDirect
/** 设置数据库连接最长时间 */
public DruidPooledConnection getConnection(long maxWaitMillis) throws SQLException {
        this.init();
        if (this.filters.size() > 0) {
            FilterChainImpl filterChain = new FilterChainImpl(this);
            return filterChain.dataSource_connect(this, maxWaitMillis);
        } else {
            return this.getConnectionDirect(maxWaitMillis);
        }
}
/**超时之后放弃连接,这里仅仅是部分源码,有兴趣自己研究看全*/
public int removeAbandoned() {
      
        DruidPooledConnection pooledConnection;
        try {
            iter = this.activeConnections.keySet().iterator();
​
            while(iter.hasNext()) {
                pooledConnection = (DruidPooledConnection)iter.next();
                if (!pooledConnection.isRunning()) {
                    long timeMillis = (currrentNanos - pooledConnection.getConnectedTimeNano()) / 1000000L;
                    if (timeMillis >= this.removeAbandonedTimeoutMillis) {
                        iter.remove();
                        pooledConnection.setTraceEnable(false);
                        abandonedList.add(pooledConnection);
                    }
                }
            }
        } finally {
            this.activeConnectionLock.unlock();
        }
    }

2.3 bug再现

    根据上述分析,我们采用手动sleep20分钟来看看是否是这样。
    样板(1)发3条数据,sleep19分钟
    样板(2)发2条数据,sleep20分钟
发起时间                结束时间            流水号    
2020-01-09 14:18:40                     23
2020-01-09 14:18:30                     22
2020-01-09 14:13:10 2020-01-09 14:18:01 21
2020-01-09 13:57:50 2020-01-09 14:18:01 20
2020-01-09 13:57:40 2020-01-09 14:18:00 18
2020-01-09 13:51:25 2020-01-09 13:57:24 17
2020-01-09 13:51:20 2020-01-09 13:57:23 16
2020-01-09 13:50:40 2020-01-09 13:57:21 15
2020-01-09 13:31:01 2020-01-09 13:47:11 14
2020-01-09 13:28:20 2020-01-09 13:47:10 13
2020-01-09 13:13:09 2020-01-09 13:13:14 12

3.问题解决

方法一:一次处理的数据小一点,只要保证20分钟处理完就行。

方法二:设置更长的数据库连接时间。

 

感谢付总,郝总一起分析研究。

<think>好的,用户想了解如何在Druid中配置连接超时时间。首先我需要回顾Druid的相关配置参数。根据引用[4]和[5],Druid有几个关键参数需要关注:maxWait、connectTimeout、socketTimeout,还有phyTimeoutMillis。 maxWait参数是获取连接时的最大等待时间,单位毫,默认1。如果超过这个时间还没拿到连接,就会抛出超时异常。比如用户提到的报错中就有wait millis 1000,这说明maxWait可能设置的是1000毫。这时候可能需要适当调大这个值,但也不能太大,否则可能导致线程堆积。 接下来是connectTimeout,这个是指建立TCP连接超时时间,默认也是1。如果数据库服务器响应慢,或者网络有问题,可能需要增加这个值,避免在连接阶段就失败。 socketTimeout是网络数据传输的超时时间,默认不设置。如果查询执行时间较长,这个参数需要调大,否则可能在数据传输过程中被中断。比如执行复杂查询时,设置过小的socketTimeout会导致查询中途超时。 然后phyTimeoutMillis是物理连接的最大存活时间,默认-1,即不限制。如果设置了这个值,连接在超过指定时间后会被强制关闭,即使它处于空闲状态。这可以防止数据库服务端主动断开导致的异常,但需要根据实际情况调整,避免频繁重建连接影响性能。 另外引用[4]中提到,当出现连接获取异常时,需要检查活跃线程数和运行中的SQL数量,可能需要调整maxActive参数,确保连接池足够处理并发请求,同时结合超时时间避免线程长时间等待。 用户可能遇到的问题是在高并发场景下,默认的maxWait太短,导致获取连接超时。这时候需要综合maxActive和maxWait,适当增加maxActive并调整maxWait。同时,如果数据库服务器响应慢,connectTimeout和socketTimeout也需要相应调整。 最后,配置示例需要展示这些参数的正确写法,比如在Spring Boot的配置文件中如何设置。还要提醒用户测试配置后的效果,使用监控功能观察连接池状态,如引用[1]提到的Druid监控功能,实时查看连接池情况,确保配置合理有效。</think>在Druid数据库连接池中,配置超时时间主要涉及以下关键参数及其实现方法: ### 一、核心超时参数配置 1. **连接获取超时(maxWait)** ```properties # 单位毫,默认值1000(1) spring.datasource.druid.maxWait=3000 ``` 当所有连接被占用时,新请求等待连接的最长时间。若超时则抛出$GetConnectionTimeoutException$,建议根据业务并发量调整[^4] 2. **TCP连接超时(connectTimeout)** ```properties # 建立物理连接超时时间,默认值1000ms spring.datasource.druid.connectTimeout=5000 ``` 适用于网络环境不稳定或跨机房访问场景 3. **数据传输超时(socketTimeout)** ```properties # SQL执行网络超时时间,默认值0(无限制) spring.datasource.druid.socketTimeout=60000 ``` 需大于最长SQL执行时间,避免查询被意外中断 ### 二、高级配置 4. **物理连接存活时间(phyTimeoutMillis)** ```properties # 物理连接最大存活时间(默认-1不限制) spring.datasource.druid.phyTimeoutMillis=7200000 ``` 强制过期旧连接防止数据库服务端主动断开[^5] 5. **心跳检测配置** ```properties spring.datasource.druid.keepAlive=true spring.datasource.druid.timeBetweenEvictionRunsMillis=60000 ``` 通过心跳保持连接活性,检测间隔建议设置为30-60 ### 三、配置示例(application.yml) ```yaml spring: datasource: druid: maxWait: 3000 connectTimeout: 5000 socketTimeout: 30000 phyTimeoutMillis: 1800000 validationQuery: "SELECT 1" testWhileIdle: true timeBetweenEvictionRunsMillis: 60000 ``` ### 四、监控与调优建议 1. 通过Druid内置监控查看$WaitThreadCount$和$NotEmptyWaitCount$指标[^1] 2. 当出现$GetConnectionTimeoutException$时,需检查: - 活跃连接数是否达到$maxActive$上限 - SQL执行时间是否超过$socketTimeout$ - 数据库服务器负载情况 3. 生产环境建议设置$maxWait$为平均SQL执行时间的3倍
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值