Hadoop之——HBase注意事项

最新推荐文章于 2025-09-05 15:08:23 发布

weixin_33948416

最新推荐文章于 2025-09-05 15:08:23 发布

阅读量106

点赞数

文章标签：大数据 java 数据库

本文介绍了HBase的NoSQL数据模型，包括表、行键、列族等核心概念，并详细说明了HBase如何通过时间戳支持数据版本控制。此外，还提供了HBase伪分布式环境的安装步骤。

转载请注明出处:http://blog.youkuaiyun.com/l1028386804/article/details/46447573

1.HBase(NoSQL)的数据模型

1.1 表(table)

存储管理数据的。

1.2 行键(row key)

类似于MySQL中的主键。

行键是HBase表天然自带的。

1.3 列族(column family)

列的集合。

HBase中列族是须要在定义表时指定的，列是在插入记录时动态添加的。
HBase表中的数据，每一个列族单独一个文件。

1.4 时间戳(timestamp)

列(也称作标签、修饰符)的一个属性。

行键和列确定的单元格，能够存储多个数据，每一个数据含有时间戳属性，数据具有版本号特性。
假设不指定时间戳或者版本号。默认取最新的数据。

1.5 存储的数据都是字节数组。

1.6 表中的数据是依照行键的顺序物理存储的。

2.HBase的物理模型

2.1 HBase是适合海量数据(如20PB)的秒级简单查询的数据库。

2.2 HBase表中的记录。依照行键进行拆分。拆分成一个个的region。

很多个region存储在region server(单独的物理机器)中的。

这样。对表的操作转化为对多台region server的并行查询。

3.HBase的体系结构

3.1 HBase是主从式结构，HMaster、HRegionServer

4.HBase伪分布安装

4.1 解压缩、重命名、环境变量设置

4.2 改动$HBASE_HOME/conf/hbase-env.sh

改动内容例如以下：

export JAVA_HOME=/usr/local/jdk
export HBASE_MANAGES_ZK=true

4.3 改动$HBASE_HOME/conf/hbase-site.xml

改动内容例如以下：

   <property>
      <name>hbase.rootdir</name>
      <value>hdfs://hadoop0:9000/hbase</value>
   </property>
   <property>
      <name>hbase.cluster.distributed</name>
      <value>true</value>
   </property>
   <property>
      <name>hbase.zookeeper.quorum</name>
      <value>hadoop0</value>
   </property>
   <property>
      <name>dfs.replication</name>
      <value>1</value>
   </property>

4.4 (可选)文件regionservers的内容为hadoop0

4.5 启动hbase。运行命令start-hbase.sh

******启动hbase之前，确保hadoop是执行正常的，而且能够写入文件*******

4.6 验证：

(1)运行jps，发现新添加了3个java进程，各自是HMaster、HRegionServer、HQuorumPeer

(2)使用浏览器来访问http://hadoop0:60010

版权声明：本文博主原创文章，博客，未经同意不得转载。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。