
本文从全局出发,详细讲解了HBase的Replication和Replication Endpoint的用法及实践。
往期文章回顾:一文读懂HBase多租户
Replication:复制,指的是持续的将同一份数据拷贝到多个地方进行存储,是各种存储系统中常见而又重要的一个概念,可以指数据库中主库和从库的复制,也可以指分布式集群中多个集群之间的复制,还可以指分布式系统中多个副本之间的复制。它的难点在于数据通常是不断变化的,需要持续的将变化也反映到多个数据拷贝上,并保证这些拷贝是完全一致的。
通常来说,数据复制到多个拷贝上有如下好处:
多个备份提高了数据的可靠性
通过主从数据库/主备集群之间的复制,来分离OLTP和OLAP请求
提高可用性,即使在单副本挂掉的情况下,依然可以有其他副本来提供读写服务
可扩展,通过增加副本来服务更多的读写请求
跨地域数据中心之间的复制,Client通过读写最近的数据中心来降低请求延迟
HBase中的Replication指的是主备集群间的复制,用于将主集群的写入记录复制到备集群。HBase目前共支持3种Replication,分别是异步Replication、串行Replication和同步Replication。
异步Replication

本文详细介绍了HBase的Replication机制,包括异步、串行和同步Replication的工作原理,以及如何解决数据一致性问题。通过WAL日志,HBase在主备集群间复制数据,保证高可用性和数据可靠性。串行Replication通过Barrier确保写入顺序,同步Replication则在写入时同步到备集群,实现强一致性。此外,还探讨了自定义Replication Endpoint的应用,如跨表复制和流处理。
最低0.47元/天 解锁文章
597

被折叠的 条评论
为什么被折叠?



