CAP理论
CAP:一个分布式系统不能同时满足一致性,可用性,和分区容错性
C一致性:任何一个读操作总是能读取到之前完成的写操作结果,也就是在分布式环境中,多点的数据是一致的
A可用性:每个操作总是能在确定的时间内返回,也不是系统随时都能正常运行
P分区容错性:在出现断网情况下,分离的系统也能正常运行
BASE
(ACID)关系型数据库:一致,隔离,原子,持久
BASE是反关系型数据库:牺牲高一致性,获得可用性。
BA:基本可用
S:软状态,可以有一段时间不同步
E:最终一致,而不是时时一致


架构


HMaster:是Hbase集群的主节点,管理和分配Region,实现RegionServer的负载均衡,发现失效的RegionServer并重新分配其上的Region
RegionServer:负责管理维护Region,RegionServer存放在DateNode上
Hlog:进行一个写请求,会首先写到MemStore上,等到Memstore到达一定容

本文探讨了CAP理论,解释了分布式系统中的一致性、可用性和分区容错性的权衡。接着,详细介绍了HBASE的架构,包括HMaster、RegionServer和Hlog的工作原理。此外,还概述了HBASE的搭建步骤,如Zookeeper的安装和配置。最后,提及了使用Sqoop进行数据导入的相关信息。
最低0.47元/天 解锁文章
824

被折叠的 条评论
为什么被折叠?



