Hive安装与配置

本文详细介绍了如何使用MySQL作为远程仓库搭建Hive及Metastore,包括配置Hive-site.xml,设置环境变量,格式化数据库等步骤,为Hadoop分布式文件系统中的数据提供SQL查询分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


date: 2019-03-23 16:28:21


Hive

Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据。其在Hadoop的架构体系中承担了一个SQL解析的过程,它提供了对外的入口来获取用户的指令然后对指令进行分析,解析出一个MapReduce程序组成可执行计划,并按照该计划生成对应的MapReduce任务提交给Hadoop集群处理,获取最终的结果。元数据——如表模式——存储在名为metastore的数据库中。

Metastore

metastore是Hive元数据集中存放地。它包括两部分:服务和后台数据存储。有三种方式配置metastore:内嵌metastore、本地metastore以及远程metastore。
本次搭建中采用MySQL作为远程仓库,部署在master节点上,hive服务端也安装在master上,hive客户端即hadoop-slave访问hive服务器。

下载

hive:可以选择国内apache镜像站下载hive

mysql数据库java驱动:mysql官网下载

配置

1.安装mysql/mariadb数据库,启动并建立hive数据库。

2.开启远程连接权限

> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%'IDENTIFIED BY '000000' WITH GRANT OPTION;
> flush privileges;

3.复制hive目录下的conf/hive-default.xml.template改名为conf/hive-site.xml

4.编辑conf/hive-site.xml文件

<configuration>
        <property>
                <name>hive.metastore.local</name>
                <value>true</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://master:3306/hive?characterEncoding=UTF-8</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionDriverName</name>
                <value>com.mysql.jdbc.Driver</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionUserName</name>
                <value>hive</value>
        </property>
        <property>
                <name>javax.jdo.option.ConnectionPassword</name>
                <value>000000</value>
        </property>
        <property>
                <name>hive.server2.authentication</name>
                <value>NONE</value>
        </property>
        <property>
                <name>hive.server2.thrift.client.user</name>
                <value>root</value>
        </property>
        <property>
                <name>hive.server2.thrift.client.password</name>
                <value>000000</value>
        </property>
</configuration>

5.配置环境变量

JAVA_HOME=/usr/share/jdk
JRE_HOME=$JAVA_HOME/jre
HADOOP_HOME=/usr/share/hadoop
HIVE_HOME=$HADOOP_HOME/apache-hive-2.3.4-bin
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/bin:$HIVE_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export JAVA_HOME JRE_HOME PATH CLASSPATH HADOOP_HOME HIVE_HOME

6.格式化数据库(如果漏掉这一步,hive启动会报错)

./schematool --dbType mysql --initSchema

7.启动Hive CLI

$ hive

8.将hive传输到slave节点

scp -r /usr/share/hadoop/apache-hive-2.3.4-bin/ slave:/usr/share/hadoop

9.修改slave节点的conf/hive-site.xml文件

<configuration>
        <property>
                <name>hive.metastore.uris</name>
                <value>thrift://master:9083</value>
        </property>
</configuration>            
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值