先查后改导致的并发修改异常,出现了两个相同编号的数据

喵&汪

已于 2023-09-27 16:20:37 修改

阅读量555

点赞数 1

文章标签：数据库 spring boot mybatis

于 2023-09-27 16:12:53 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_64551008/article/details/133352275

版权

文章讲述了在处理数据库编号并发生成时遇到的bug，涉及并发控制、InnoDB的行锁、forupdate和synchronized的使用，以及事务传播属性对问题的影响。作者最终通过调整事务传播策略和避免在同一类中跨方法调用事务方法解决了问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

bug主要情况是：通过调用方法获取编号，而这个编号是递增有序的，并且存在于数据库中，简单理解就是需要用到这种编号(以下称任务编号)，需要从数据库获取出来，在+1最为本次需要的编号，然后在存回数据库中，提供下次使用。直观来看是没得问题的，但是，可能在某次并发的时候出现编号相同,这个lastId,每次生成工单编号会根据lastId生成一个String的编号,然后让这个lastId+1,这样每次生成的编号就不一样,然后问题就是在并发情况下,会生成相同的编号,产生问题的原因就是,我先查数据库的lastId, 然后去修改lastId,从查询到修改中间会有一段时间来执行业务逻辑,并发情况下,两个请求从同一个接口进来,第一个请求查询到的lastId,但是在第一个请求修改lastId之前,第二个请求已经进来了,查询到lastId和第一个请求一样,导致工单编号一样

错误的原代码

经过多次修改后最终无bug的代码(其实还有问题,笔者后面也会提到,请听后文分解)

心路历程,在原代码出现bug后,第一次修复,在语句最后加上了for update 读写锁 ,innodb引擎的特性行锁

这里我原代码我已经找不到了,我就用最后代码来展示,

但是我对这个语句的认识不足,导致bug再现

了for update,但是这个排他锁是不允许修改,但允许查询,相当于当前事务未提交前,其他事务不允许修改该行,但可以查询,所以问题没有解决,可以查询就会查到旧数据

第二次修改

我加上了最终加上了synchronized,得到了上面这张图的代码,synchronized用在非static修饰的方法上,锁对象为this,由于这个类加了@Component是spring单例对象,能保证对象只有一个,因为这个是Service.被spring管理,是单例的,大家用的都是同一个OpsGenerateCodeServiceImpl的getCode方法

我认为,我给查询和修改加上了锁,保证了,只有一个线程获取锁完成了查询和修改的操作后,另一个线程才能获取到锁,去进行查询和修改,相当于一个线程在进行查询和修改期间,另一个线程什么也干不了,因为没拿到锁,我当时以为很秀了,然后bug又重现了,在稍稍思考后,我敏锐地发现的问题

@Transactional的原理是AOP

我给getCode加上这个注解,最后编译的代码其实是
最终的代码其实是 try{
开启事务
执行getCode方法
}final{
提交事务
}

问题就在于我这个synchronized锁住的是getCode方法

最终的代码其实是 try{
开启事务
获取锁
执行getCode方法
释放锁
}final{
提交事务
}

事务在锁的外面

导致一个线程在执行完查询和修改lastId后,释放了锁,在还没有提交事务的情况下,另一个线程获取了锁,查询到的lastId是未修改的lastId

最后一次修改,我做了两个改变

现在锁是在getCode上,而注解是在getLastIdWithLock上

那么就getCode方法的实际是
获取锁

执行getLastIdWithLock方法
释放锁

执行getLastIdWithLock方法实际上等同与

开启事务
执行getLastIdWithLock方法
提交事务

最终效果就是getCode等同于

获取锁

开启事务
执行getLastIdWithLock方法
提交事务
释放锁

这个注解很关键

这个是很重要的,在不加这个属性的情况下,事务是加入的,而加了之后,事务是单独创建的

这个叫做事务的传播属性,默认是加入,

也就是说getCode方法执行的查询和修改,并没有开启一个新的事务,而是加入到原本就有的最上层的add方法的这个事务中,导致还是那个问题,getCode执行结束,锁释放了,但是事务还没有提交,直到add方法结束,才提交的

没加这个注释前,代码是
开始事务
执行add方法
执行getCode方法
执行add方法
提交事务

而加了propagation = Propagation.REQUIRES_NEW,就说明执行到这个方法要开启一个新事务

代码是
开始事务
执行add方法
开启getCode的专属新事务
执行getCode方法
提交getCode的专属新事务
执行add方法
提交事务

这样才能保证事务提交后,锁才释放

你以为故事到这里就结束了吗??????????????????????????

笔者敏锐的感觉到不对劲,事务失效的场景和这个有关系

在同一个类某个方法中调用另一个事务方法,该事务失效

getCode方法和 add方法在一个service中吗?不在

笔者指的是getCode方法和getLastIdWithLock方法在同一个类中,会导致如果你在getCode中直接调用getLastIdWithLock,这个getLastIdWithLock是没有事务aop的

从最终编译完成的代码来看

就是这个getCode在编译完成之后,最终会变成这样子吗????
获取锁
开启事务
执行getLastIdWithLock
关闭事务
放弃锁

实际上最终编译的代码是

它最终变成了
获取锁
执行getLastIdWithLock
放弃锁

涨知识的点来了,可能有些难以理解,但是以下语句可能不好理解,可以直接跳过看,笔者最后会有总结的话

动态代理,会生成一个OpsGenerateCodeServiceImpl代理对象,会为getLastIdWithLock这个方法,申明一个代理方法,假设叫做getLastIdWithLockWithProxy

别的类,调OpsGenerateCodeServiceImpl.getLastIdWithLock,其实是调OpsGenerateCodeServiceImpl代理对象.getLastIdWithLockWithProxy

但是OpsGenerateCodeServiceImpl本身去调自己的方法的时候,它调的是不经过aop增强的那个真实的getLastIdWithLock方法

解决方法有两种

1.在OpsGenerateCodeServiceImpl中注入自己的代理对象或者通过AopContext.currentProxy获取当前代理对象,当前前提是你要在sprping启动类上开启@EnableAspectJAutoProxy(exposeProxy = true)暴露代理类,否则平时是不允许访问这些代理类的

2.把getCode和getLastId放到不同的类中,笔者采用了这个方法,新建了一个加上@Component注解的类,把getCode方法已过去,然后把OpsGenerateCodeServiceImpl注入到这个类中,新类的getCode方法中调用OpsGenerateCodeServiceImpl.getLastId方法

那么我将用最简单的方式告诉大家如何理解同一个类中,一个方法A(不管是否被事务注解)调用另一个事务注解的方法B,事务失效

很简单,假如A方法,有一千行,其中第五百行的时候,它调用了B方法,难道aop在编译的时候,它会聪明地发现B方法是个被事务注解了的方法,于是它很聪明在第499行加上开启事务的代码,在501行加上提交事务的代码??

aop做的事情非常简单,它就看你方法A有没有事务注解,有的话就在外面套上一个开启和提交事务,方法B上面有注解,就外面套上一层代码,它不会去检查A方法中执行了B方法,B方法是事务的,所以它在A方法中,在执行到B的时候,给它套上一层,不会!!!这样效率太低,它只关心方法本身上面有没有注解,而不会去扫描方法A内部的代码,否则如果代码很长,很复杂,它要处理很久

以下任一一点不满足都会导致bug再次重现

1.先查后改这个方法的事务注解,需要用propagation = Propagation.REQUIRES_NEW

2.syncnize关键词和事务注解不能在同一个方法上,会导致syncnize没有起到你想要的效果

3.不能在同一个类中一个方法调用另一个事务方法,这会导致该事务完全失效

有一点非常值得大家警惕,就是先查后改,很多场景几乎百分百极大可能造成并发修改异常,哪怕你是上一行执行查询,下一行执行修改语句!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

比方说mysql有个用户表,有两个人,一个人先拿用户id查到用户,修改了它的密码,另一个人拿用户id查询用户,修改了账号,它们查询几乎同时,所以查到的数据一样,然后修改的时候修改密码先执行了,然后才执行另一个人的修改账号,最终结果是,账号被修改了,密码没修改,因为第二个人拿到的密码是原先的密码,它在执行修改账号的时候,顺便的就把密码也修改到原先的密码了,当然这是mybatisplus的updateById经常会发生的事情

当然笔者在考虑这个编号重复的时候,肯定有想到那个经典的解决方案,redis分布式锁,笔者使用了synchronized去锁,其实也可以用redis的setNx方法设置锁,但是又会引发一系列的锁过期(方法没执行完,锁失效了,另一个接口进来了),锁续期(引入redisson,用它的sexNx会自动创建一个守护线程不断刷新锁的失效时间),太麻烦了,懒得搞,我这个synchronized能用就行,也没啥流量,不担心速度慢,如果你用户很多,我建议还是用redis,因为synchronized是个重量锁,总归要慢一些,但其实也还行