Sharding运行模式、元数据、持久化详解

最新推荐文章于 2025-06-01 09:16:51 发布

原创

最新推荐文章于 2025-06-01 09:16:51 发布 · 1.8k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#架构 #微服务 #go #数据库 #分布式 #后端 #中间件

运行模式

单机模式

能够将数据源和规则等元数据信息持久化，但无法将元数据同步至多个Sharding实例，无法在集群环境中相互感知。通过某一实例更新元数据之后，会导致其他实例由于获取不到最新的元数据而产生不一致的错误。适用于工程师在本地搭建 Apache ShardingSphere 环境。

支持持久化类型jdbc

集群模式

提供了多个Sharding实例之间的元数据共享和分布式场景下状态协调的能力。在真实部署上线的生产环境，必须使用集群模式。它能够提供计算能力水平扩展和高可用等分布式系统必备的能力。集群环境需要通过独立部署的注册中心来存储元数据和协调节点状态。

支持持久化配置ZooKeeper、Etcd

总结一下，这两种模式的主要区别在于，运行多个节点的时候，元数据是否共享。比如，你运行了多个单机模式的proxy，这时候，你登录其中一个proxy节点，去新增一张表，那么这张新增的表，只能够在你操作的proxy节点看到，其他节点是看不到的。其他节点要是想要看到的话，也是有一些办法的，等说过元数据之后，咱们再谈一谈单节点之间如何实现数据的共享。而集群模式则能够实现多个节点的元数据共享，当我们在其中一个节点中新增了一张表，其他节点也能够看到新增的表，因为集群模式下，所有的节点的元数据是同步的。这种同步，是通过ZooKeeper或者Etcd这样的中间件实现的。

元数据

元数据是表示数据的数据。从数据库角度而言，则概括为描述数据库的数据。因此如列名、数据库名、用户名、表名等以及数据自定义库表存储的关于数据库对象的信息都是元数据。而 ShardingSphere 中的核心功能如数据分片、加解密等都是需要基于数据库的元数据生成路由或者加密解密的列实现，由此可见元数据是ShardingSphere 系统运行的核心，同样也是每一个数据存储相关中间件或者组件的核心数据。

也就是说，ShardingS