分库分表对老业务功能带来的冲击

最新推荐文章于 2023-02-01 23:03:14 发布

原创最新推荐文章于 2023-02-01 23:03:14 发布 · 230 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#分库分表 #前置表 #联表查询 #tair #tddl

技术笔记小点滴专栏收录该内容

6 篇文章

订阅专栏

本文探讨了业务数据增长导致的单库单表性能瓶颈，并提出了通过分库分表解决这一问题的方法。具体分析了分库分表后面临的三个挑战：根据主键查询签约信息、插入数据时userId缺失、跨库联表查询，并给出了相应的解决方案。

本文为原创，转载请注明出处

分库分表对老业务功能带来的冲击

当业务量发展到一定的程度时，不可避免的需要对数据进行分库分表。以用户的签约数据为例，当用户量很少时，单库单表是可以满足的，但当用户量达到某个级别，譬如亿级，那么单库就会成为瓶颈，需要根据某种维度（譬如userId）来进行分库分表。

分库分表如何实现本文就不阐述了，可以参考一下淘宝的tddl。本文主要阐述分库分表过程中对老业务逻辑带来的冲击以及如何改造，因为有些原来单库单表中很容易实现的功能，一经分库分表后，就变的很棘手，譬如：

a）根据主键ID（非userId）查询签约信息：

b）插入数据时，userId为空

c）联表查询，多个表不在同一个库里

1、首先来分析第一个问题：根据主键ID（非userId）查询签约信息。

由于根据userId来进行分库，那么根据ID是无法知道该去哪个库查询，当然可以采取全库扫描，但一般这在性能上是无法接受的，违背了分库分表的初衷。可以采取以下几种方案：

1.1、在进行查询前，如果能拿到userId，则改造为根据userId和id两个条件去查询。

1.2、如果拿不到userId，那么对于老数据，需要建立一个前置表，该表存储id和userId的映射关系(即：该表只有两个字段，id和userId)。根据ID查询前，先根据ID去查询前置表，得到userId，然后再根据userId和id两个条件查询。

分库分表前

分库分表后

需要注意的是，该前置表只需要存储老数据的映射关系(该表的数据由系统发布上线前对老数据迁移得到，发布上线后，不会再有新数据写入)，对于新数据，在生成ID时，ID需要包含所属库和所属表的标示，这样根据ID查询新数据时就可以直接路由到具体的库和表了，不需要再查询前置表。那么根据ID如何区分新老数据呢，可以根据ID的长度（一般分库后的ID位数会扩容）

2、接着分析第二个问题：插入数据时，userId此时为空

在分库分表前，有些业务流程在执行过程中，插入数据时没有分库分表的维度信息譬如userId，只有执行某个业务操作譬如用户登陆后才能得到userId，然后更新这条记录以补全userId。

分库分表前

那么分库分表后，在插入数据的那个时刻，就无法知道该把数据插入到哪个库哪个表。针对这种情况，需要对插入数据的流程进行改造。

先将数据进行临时存储，譬如存储在集中式缓存（tair、memcache等）等用户登陆后拿到userId后，再从缓存中查询出数据，然后再插入数据到DB中。

分库分表后

3、再来看第三个问题：联表查询，多个表不在同一个库里

对联表查询进行拆分，保证被拆分过后的原子查询都落在相同的库里。当然，对于左联结或右联结查询，要特备注意拆分前后结果的一致性，很有可能会出现拆分后结果记录数减少的情况，需要重点测试。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。