垂直拆分:
分库:以表为依据,将不同表放在不同的服务器不同的数据库中。
分表:以字段为依据,根据不同的属性将不同字段拆分到不同的表中
水平拆分:
分库:不拆分数据库结构,将数据拆分到不同的数据库中。
分表:不拆分表结构,拆分表数据。
这样子看起来还是有点模糊不是很清晰,举个例子:
比如我有一个电商系统,有三类表,商品相关,订单相关和用户相关。
数据较多一个服务器放不下,那么我就可以根据这三类垂直划分三个数据库。
这里有个问题是更新新增单标查询相对比较简单直接更新就好了,但是多表联查尤其是跨库之间的多表联查是个问题,其中之一的解决办法就是全局数据,把涉及到所有需要联查的数据在每个数据库都存放一份。
而随着时间的增加,订单表数据越来越多。一个服务器顶不住了,好了可以把订单相关表水平分开。
具体要怎么分呢?有 多种方式:根据ID取模,根据ID的范围,枚举,一致性哈希,甚至按时间分。
但是如果说我分了三个库,几年之后又满了呢?那只能增加服务器,然后迁移数据,
想要避免这种情况,一开始就多几台机器。当然如果公司抠抠搜搜的页没有太多好的办法。
但是随着基于软件的虚拟技术成熟,服务可以自动扩展的今天应该还是有自动缩放的解决方案。
然后是分库分表的具体的实现:
shardingJDBC: https://shardingsphere.apache.org/
mycat中间件:http://mycat.org.cn/
先记录一下 我还会回来的。
mysql读写分离:
读写分离式基于mysql的主从复制。主从复制的原理是 从库有一个IO线程会读取主库的二进制日志,写入自己的中继日志,然后还有一个sql线程会读取中继日志,将数据插入数据库。
如果想要实现读写分离,可以在应用里面配置多个数据源,也是有技术支持的,但是同样的可以通过mycat实现读写分离。
一主一从可用性不是很高,可以配置双主双从。原理就是两个master互为slave,然后各自还有一个slave,四台服务器。
还是那句话 我还会回来的。