01-分库分表-总体概述

本文介绍了分库分表的原因,从数据库性能瓶颈、优化方案等方面进行探讨。讨论了何时需要分库分表,并详细阐述了垂直切分和水平切分的类型和特点,包括单库垂直分表、多库垂直分表、单库水平分表和多库水平分表。同时,文章指出了分库分表带来的问题,如跨库关联查询、分布式事务等,并提出了解决方案。最后,针对全局主键避重问题提出了多种策略,如UUID、数据库序号维护和雪花算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分库分表-总体概述

为什么要分库分表

数据库性能瓶颈的出现

对于应用来说,如果数据库性能出现问题,要么是无法获取连接,是因为在高并发的情况下连接数不够了。要么是操作数据变慢,数据库处理数据的效率出了问题。要么是存储出现问题,比如单机存储的数据量太大了,存储的问题也可能会导致性能的问题。

归根结底都是受到了硬件的限制,比如 CPU,内存,磁盘,网络等等。但是我们优化肯定不可能直接从扩展硬件入手,因为带来的收益和成本投入比例太比。

所以我们先来分析一下,当我们处理数据出现无法连接,或者变慢的问题的时候,我们可以从哪些层面入手。

数据库优化方案对比

数据库优化有很多层面。

SQL 与索引

因为SQL语句是在我们的应用端编写的,所以第一步,我们可以在程序中对SQL语句进行优化,最终的目标是用到索引。这个是容易的也是最常用的优化手段。

表与存储引擎

第二步,数据是存放在表里面的,表又是以不同的格式存放在存储引擎中的,所以我们可以选用特定的存储引擎,或者对表进行分区,对表结构进行拆分或者冗余处理, 或者对表结构比如字段的定义进行优化。

架构

第三步,对于数据库的服务,我们可以对它的架构进行优化。

如果只有一台数据库的服务器,我们可以运行多个实例,做集群的方案,做负载均衡。

或者基于主从复制实现读写分离,让写的服务都访问master服务器,读的请求都访问从服务器,slave服务器自动master主服务器同步数据。

或者在数据库前面加一层缓存,达到减少数据库的压力,提升访问速度的目的。

为了分散数据库服务的存储压力和访问压力,我们也可以把不同的数据分布到不同的服务节点,这个就是分库分表(scale out)。

注意主从(replicate)和分片(shard)的区别:

  • 主从通过数据冗余实现高可用,和实现读写分离。
  • 分片通过拆分数据分散存储和访问压力。
配置

第四步,是数据库配置的优化,比如连接数,缓冲区大小等等,优化配置的目的都是为了更高效地利用硬件。

操作系统与硬件

最后一步操作系统和硬件的优化。

从上往下,成本收益比慢慢地在增加。所以肯定不是查询一慢就堆硬件,堆硬件叫做向上的扩展(scale up)。

什么时候才需要分库分表呢?我们的评判标准是什么?

如果是数据量的话,一张表存储了多少数据的时候,才需要考虑分库分表?

如果是数据增长速度的话,每天产生多少数据,才需要考虑做分库分表?

如果是应用的访问情况的话,查询超过了多少时间,有多少请求无法获取连接,才需要分库分表?这是一个值得思考的问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值