1.HBase 简介
Hbase-Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可以在廉价PC Server上搭建起大规模化存储集群。HBase利用Hadoop HDFD作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。
2.HBase新概念
(1)主键:Row Key
主键是用来检索记录的主键,访问Hbase table中的行,只有三种方式
(1.1)通过单个row key访问。
(1.2)通过row key的range
(1.3)全表扫描
3.列族:Cloumn Family
列族在创建表的时候声明,一个列族可以包含多个,列中的数据都是以二进制形式存在,没有数据类型。
4.时间戳:timestamp
HBase中通过row和columns确定的为一个存储单元称为cell。每个cell保存着同一份数据多个版本。版本通过时间戳来索引。
本文介绍了HBase的基本概念,包括其作为高可靠性和高性能的分布式存储系统的特性,并详细解释了HBase中的主键(RowKey)、列族(ColumnFamily)和时间戳(Timestamp)等核心概念。
2万+

被折叠的 条评论
为什么被折叠?



