实验 目的 要求 |
目的: (1)掌握数据仓库工具Hive的使用; 要求:
|
实 验 环 境
|
软件版本: 选用Hive的2.1.1版本,软件包名apache-hive-2.1.1-bin.tar.gz;
|
练习内容
步骤一:Hive工具安装配置
1、集群的启动;
★ 该项的所有操作步骤使用专门用于集群的用户admin进行。
★ 启动HBase集群之前首先确保Zookeeper集群已被开启状态。(实验5台),Zookeeper的启动需要分别在每个计算机的节点上手动启动。如果家目录下执行启动报错,则需要进入zookeeper/bin目录执行启动命令。
★ 启动HBase集群之前首先确保Hadoop集群已被开启状态。 (实验5台)Hadoop只需要在主节点执行启动命令。
a) 在集群中所有主机上使用命令“zkServer.sh status”查看该节点Zookeeper服务当前的状态,若集群中只有一个“leader”节点,其余的均为“follower”节点,则集群的工作状态正常。如果Zookeeper未启动,则在集群中所有主机上使用命令“zkServer.sh start”启动Zookeeper服务的脚本;
b) 在主节点,查看Java进程信息,若有名为“NameNode”、“ResourceManager”的两个进程,则表示Hadoop集群的主节点启动成功。在每台数据节点,若有名为“DataNode”和“NodeManager”的两个进程,则表示Hadoop集群的数据节点启动成功, 如果不存在以上三个进程,则在主节点使用此命令,启动Hadoop集群。
主节点及备用主节点:
通信节点:
c) 确定Hadoop集群已启动状态,然后在主节点使用此命令,启动HBase集群, 在集群中所有主机上使用命令“jps”;
2、在主节点使用命令“hive”启动Hive,启动成功后能够进入Hive的控制台。
3、在控制台中使用命令“show databases;”查看当前的数据库列表。
练习:
1、启动Hive,Hive常用命令;
命令:
$hive #启动Hive,启动成功后能够进入Hive的控制台
>show databases; #查看当前的数据库列表
>create database test1; #创建数据库