Hbase是什么
Hbase是一个开源的、分布式的、版本化的非关系型数据库,它利用 Hadoop 分布式文件系统提供分布式数据存储 随机访问存取和检索数据 存储结构化和半结构化的数据 因此一般的网站可以将网页内容和日志信息都存在 HBase 里。
Hbase数据模型
逻辑结构
物理存储结构
Hbase下载,安装,部署
HBase的三种运行模式 单机模式,又称独立模式(支持windows,不需要hadoop的支持、内置zookeeper) 本地伪分布式模式(不支持windows,可选hadoop的支持,zookeeper可选择内置或外置) 分布式模式(不支持windows,多机、分布式)
1.官网下载相关版本的HBase(http://archive.apache.org/dist/hbase/) Hadoop(http://archive.apache.org/dist/hadoop/core/) Hadoop与HBase的版本匹配(其实对JDK也有要求,但JDK8是都支持的,所以准备JDK8就没有问题了。)
2.解压下载好的压缩包
3.配置环境:添加环境变量,添加系统变量JDK(JAVA_HOME),hadoop(HADOOP_HOME) ,HBase(HBASE_HOME) 在Path中新增%HBASE_HOME%\bin
4.配置文件 HBase/conf下的 1.hbase-env.cmd: set JAVA_HOME=D:\java\jdk1.8.0_111(本机JDK的安装路径) set HBASE_MANAGES_ZK=true(使用内部zookeeper) 2.hbase-env.sh export JAVA_HOME export HBASE_MANAGES_ZK
HBASE SHELL操作
1.在命令行进入Hbase Shell 于命令行进入Hbase.bin的地址,输入start-hbase.cmd,之后再输入hbase shell 进入操作。
2.建表 create ‘名称’,’info’ 其中名称就是表名,info是列族,在建表时无需进行限定操作。
3.插入数据 put ‘表名’,‘行号’,‘有限定的列族(info:XXX)’,‘属性值’
4.更新数据 put ‘表名’,‘行号’,‘有限定的列族(info:XXX)’,‘所更改属性值’
5.查看表的数据 scan ‘表名’
6.查看指定行的数据 get ‘表名’,’行号’
7.查看指定列族:列的数据 get ‘表名’,’行号’,‘有限定的列族’
8.统计表中数据的行数 count ‘表名’
9.删除表中的某行全部数据 deleteall ‘表名’,’行号’
10.删除某行某列数据 delete ‘表名’,’行号’,’列族’
11.清空表数据 truncate ‘表名’
12.删除表 disable ‘表名’ drop ‘表名’ 提示:如果直接 drop 表,会报错:ERROR: Table student is enabled. Disable it first.