一、HBase简介
1、 bigtable:主要是满足互联网搜索引擎的基本需求、用于网页搜索、用于谷歌非常多的项目中,包括搜索,地图,财经,打印等、还有一些社交网站,博客网站等。分布式存储系统(bigtale):基于谷歌分布式文件系统 GFS 完成存储,利用 Chubby 做协同管理。
2、 HBase:分布式数据库,可以存储非结构化和半结构化的松散数据。水平扩展的方式,允许几千台服务器去存储海量文件。HBase产生原因:HDFS和MapReduce,hadoop主要解决大规模离线数据批量处理,没有办法满足大数据实时处理需求。
3、 HBase和传统关系型数据库的区别?
数据类型:传统的关系型数据库用的是非常经典的关系数据模型。HBase数据存储为字符串。
数据操作:
存储模型:HBase基于列存储。传统的关系型数据库基于行存储。
数据索引:HBase只支持对行键的索引。
数据维护:HBase不会删除数据旧的版本,关系型数据库在某些数据操作下会覆盖旧的数据。
可伸缩性:HBase借助分布式集群存储数据,关系型数据库很难实现水平扩展,最多可以实现纵向扩展(单核变双核,双核变四核)。
二、HBase的数据模型
大数据技术---HBase
最新推荐文章于 2023-09-25 18:52:28 发布