数据库中间件系列架构实战-功能解析_数据库中间件功能-优快云博客

本文链接：https://blog.youkuaiyun.com/zengqiang1/article/details/103758158

本文探讨了读写分离及分片的实现原理，包括主从同步、路由算法选择、数据增长后的迁移策略，以及如何避免热点问题。介绍了枚举、固定hash、范围、日期列、一致性hash等算法，并讨论了虚拟节点的概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

分片原则
1. 与拆分表有关系的表一起分表，例如事务，业务关联
2. 依据业务来分片，如果没有，才用主键分片
3. 选择的业务字段，应该是最频繁的或者最重要的查询条件
4. 选择的业务字段，应该能尽可能均匀的分布到所有的节点
水平拆分

在这里插入图片描述

在这里插入图片描述

如果我按照oid拆分，但是我现在查询语句只有uid，那么就会全表扫描

在这里插入图片描述

如果我按照uid拆分，但是我现在查询语句只有oid，那么也会全表扫描

在这里插入图片描述

那么我可以进行二维拆分，同时按照oid和uid进行拆分

在这里插入图片描述

此时如果我的查询条件既有oid又有uid，那么我很容易找到我需要的数据

在这里插入图片描述

如果查询条件只有oid，那么就会扫描带有oid的那一个系列

在这里插入图片描述

同理，如果查询条件只有uid，那么就会扫描带有uid的那一个系列

固定哈希算法足够简单实用，根据数据特点能够均匀分布，但是在数据库扩容的时候，固定哈希算法迁移非常复杂，由于取模的结果变化，绝大部分数据都要进行迁移，当数据库倍增的时候，数据迁移最少，但也高达 50%，而且倍增的成本比较高。
一致性hash的原理就是通过该算法计算出 key 的 hashcode 之后进行 2^32 取模，那么数据就会落在 0~2^32 所组成的环中；然后对现在提供的节点进行范围分配，假设我有8个节点，将0～2^32的范围均分到每个节点，然后根据取模之后的值计算落到哪个节点。好处是现在我发现第5号节点压力过大，我想加一个节点，那么我只需要将5号节点的范围缩小一半，然后使用新加入的节点负责另一半，此时只需要迁移5号节点的另一半数据，如果数据分布均匀，迁移的数据就只有16分之一
虚拟节点，有时候会出现热点问题，一致性哈希并不能解决。所以可以引入虚拟节点的概念，它是物理节点的映射，一个物理节点可以复制出多个虚拟节点，尽可能的让它均匀分布在环上，那么即使数据再集中，其实也会存储在不同的节点上，可以起到负载均衡的作用。