Spring Batch事务处理

本文详细探讨了Spring Batch的事务模型,包括step之间的事务独立,chunk的事务处理,以及不同情况下的事务提交与回滚策略。同时,文章还讨论了如何配置事务行为,任务恢复,跳过错误数据,重试机制,以及reader和processor的事务特性。最后,建议在使用Spring Batch时,应确保其批量处理功能与业务逻辑分离,以降低复杂性和提高可理解性。
事务模型描述

1、step之间事务独立
2、step划分成多个chunk执行,chunk事务彼此独立,互不影响;chunk开始开启一个事务,正常结束提交
    
图-job总体事务


图-step内部事务

3、chunk定义:默认设置commitInterval=N,即读取N条数据为一个chunk(采用默认SimpleCompletionPolicy),或者reader里面所读取的item==null,或者满足自定义完成策略  
    

事务提交&回滚

1、事务提交条件:chunk执行正常,未抛RuntimeExecption
2、默认情况下,Reader、Processor、Writer抛出未捕获RuntimeException,当前chunk事务回滚,step失败,job失败
3、通过以下配置,保证出现异常时,事务不回滚,事务继续提交:
<batch:tasklet>
<batch:chunk />
<batch:no-rollback-exception-classes>
<batch:include class="com.xx.batch.DefRuntimeException"/>
</batch:no-rollback-exception-classes>
</batch:tasklet>
4、事务配置.通过以下配置,改变事务行为
<batch:tasklet>
<batch:transaction-attributes isolation="READ_COMMITTED" propagation="REQUIRES_NEW" timeout="300"/>
<batch:chunk reader="defItemReader" processor="defItemProcessor" writer="defItemWriter" commit-interval="10"/>
</batch:tasklet>
默认配置:DEFAULT+REQUIRED


参数配置影响

1、任务恢复
    
<batch:job id="jobId" restartable="true">
</batch:job>
    通过配置job的restartable=true,保证任务失败后能够进行恢复。比如:文件处理时,chunkSize=10,在line=35时处理失败,文件修复后,job将从31行开始重新处理(因为1-10,11-20,21-30进行事务提交,Spring Batch将ExecutionContext中的count持久化到系统表,恢复时读取)
    FlatFileItemReader继承AbstractItemCountingItemStreamItemReader类,所以默认具备读取恢复能力
    
2、跳过
    
<batch:chunk skip-limit="20">
<batch:skippable-exception-classes>
<batch:include class="com.xx.batch.ExceptionClass" />
</batch:skippable-exception-classes>
</batch:chunk>
或者
<batch:chunk skip-policy="defSkipPolicy">
</batch:chunk>
跳过数据量或者跳过策略不满足时候,step失败,job失败 

a、ItemProcessor处理中跳过
    事务回滚,失败条目在缓存标志为跳过,并重新开启一个事务处理缓存中的条目,并提交。这个时候会重复process,如果存在业务逻辑,注意幂等性问题

b、ItemWriter处理中跳过
    事务回滚,失败条目在缓存标志为跳过,因为是批量提交,需要找出问题条目,所以针对每个条目开启一个事务循环处理process&write并提交,如果存在业务逻辑,注意幂等性问题

3、重试
<batch:chunk retry-limit="20">
<batch:retryable-exception-classes>
<batch:include class="com.xx.batch.ExceptionClass" />
</batch:retryable-exception-classes>
</batch:chunk>
或者
<batch:chunk retry-policy="defRetryPolicy">
</batch:chunk>
重试次数达到或者重试策略不满足时,step失败,job失败


4、reader-transactional-queue&processor-transactional

a、reader-transactional-queue,默认false,设置为true代表read资源具备事务特性,chunk事务回滚时,资源回滚。出现异常导致重复读取并处理,注意幂等性问题

b、processor-transactional,默认true,即writer失败时,processor重复执行,需要注意幂等性问题;设置false,即writer失败时,processor不再执行


处理组件事务

Spring  Batch提供了很多监听器等组件,在处理事务相关的问题时,参考下图进行事务考虑:
   
 图-job执行阶段轨迹&事务

    注意:ItemReadeListener、ItemProcessListener、ItemWriteListener所有监听方法均在chunk事务当中执行,所以,如果在这些监听方法里面要处理好业务事务与chunk事务的关系,最好将业务事务设置为独立REQUIRE_NEW特性,避免相互影响
    关于onXXError监听方法:改监听方法在事务回滚之前执行,或者事务提交之前执行(如果有no-rollback-exception配置)


一点点建议

    在使用Spring Batch的时候需要注意它要解决的问题域,它本身的关注点应该是提供一个批量处理的能力,即对文件或数据库的批量读取、写入和协议数据的转换,以及对整个过程的控制。
    因此,如果在批量处理过程中需要做些业务逻辑,那么业务逻辑的实现需要与它彼此独立,尽量不要在batch的处理过程中耦合业务逻辑,原因如下:
    a、Spring Batch的使用目的更加清晰
    b、避免Spring Batch事务与业务逻辑事务的交叉耦合所带来的偶发复杂性,应用已于理解
    其次,Spring Batch的系统表最好和业务数据表处于同一物理库,保证事务的一致性
### Spring Batch 事务管理的配置与使用方法 Spring Batch 提供了强大的事务管理机制,可以确保批处理任务在执行过程中保持数据一致性与完整性。事务管理在 Spring Batch 中主要依赖于 Spring 框架的事务支持,通过 `PlatformTransactionManager` 接口进行管理。以下是关于事务管理的具体配置与使用方法。 #### 1. 配置事务管理器 在 Spring Batch 中,首先需要配置一个事务管理器(`TransactionManager`)。通常使用 `DataSourceTransactionManager` 来管理 JDBC 数据源的事务。以下是一个典型的事务管理器配置示例: ```xml <!-- 创建事务管理器对象 --> <bean id="transactionManager" class="org.springframework.jdbc.datasource.DataSourceTransactionManager"> <property name="dataSource" ref="dataSource"/> </bean> ``` 该配置声明了一个事务管理器,并将其与数据源绑定,以便在批处理任务中管理事务。 #### 2. 声明事务属性 接下来,需要定义事务的属性,例如事务的传播行为、隔离级别、超时时间等。可以通过 `<tx:advice>` 标签来配置事务属性: ```xml <!-- 配置需要添加事务对应的方法的属性设置 --> <tx:advice id="interceptor" transaction-manager="transactionManager"> <tx:attributes> <tx:method name="*"/> </tx:attributes> </tx:advice> ``` 上述配置表示对所有方法应用默认的事务属性。可以根据需要为特定方法指定不同的事务属性。 #### 3. 配置 AOP 实现事务管理 为了将事务管理应用到具体的业务逻辑中,需要通过 AOP(面向切面编程)来实现。可以通过 `<aop:config>` 标签来配置切面和切点: ```xml <!-- 实现事务的AOP配置 --> <aop:config> <aop:pointcut id="pt" expression="execution(* com.feri.ssm.service.impl.*.*Batch(..))"/> <aop:advisor advice-ref="interceptor" pointcut-ref="pt"/> </aop:config> ``` 该配置定义了一个切点 `pt`,它匹配 `com.feri.ssm.service.impl` 包下所有以 `Batch` 结尾的方法,并将事务管理器 `interceptor` 应用于这些方法。 #### 4. 在批处理任务中使用事务Spring Batch 中,事务管理通常与 `Step` 结合使用。每个 `Step` 可以配置一个事务管理器,并通过 `chunk` 元素指定事务的提交间隔。以下是一个典型的 `Step` 配置示例: ```xml <batch:job id="importProductsJob"> <batch:step id="readWrite"> <batch:tasklet transaction-manager="transactionManager"> <batch:chunk commit-interval="100" skip-limit="10"> <skippable-exception-classes> <include class="org.springframework.batch.item.file.FlatFileParseException"/> <exclude class="java.io.FileNotFoundException"/> </skippable-exception-classes> </batch:chunk> </batch:tasklet> </batch:step> </batch:job> ``` 在该配置中,`transaction-manager` 属性指定了使用事务管理器,`commit-interval` 属性表示每处理 100 条记录提交一次事务。此外,还可以通过 `<skippable-exception-classes>` 配置可跳过的异常类,以便在发生特定异常时继续执行任务。 #### 5. 事务的提交与回滚 Spring Batch 支持事务的提交与回滚操作。在正常情况下,事务会在处理完指定数量的记录后自动提交。如果在处理过程中发生异常,并且该异常未被标记为可跳过,则事务将回滚到最近一次提交的状态,以确保数据的一致性。 #### 6. 事务的并发控制 Spring Batch 还支持并发处理,可以通过配置多个线程来并行执行任务。然而,在并发环境下,事务管理变得更加复杂。为了确保数据一致性,需要合理设置事务的隔离级别,并避免多个线程同时修改相同的数据。 --- ###
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值