Linux:HBase知识点笔记
文章目录
1.HBase是什么?
Hadoop database,是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是谷歌BigTable的开源实现,主要用来存储非结构化和半结构化的松散数据。
- 面向半结构化数据存储和处理的高可扩展、低写入/查询延迟的系统。
2.hbase的特点
(1)数据类型:字符串
(2)数据操作:插入、查询、删除、清空
(3)存储模式:基于列存储,每个列族都由几个文件保存,不同列族文件是分离的。
(4)数据索引:行键
(5)数据维护:更新操作时,生成新的版本,旧版本不删除仍保留。
(6)可伸缩性:能够轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩。
3.数据模型
- HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳。
- 列族支持动态扩展,可以很轻松地添加一个列族或列,无需预先定义列的数量以及类型,所有列均以字符串形式存储,用户需要自行进行数据类型转换。
- 表、行、列族、列限定符、单元格、时间戳