Hive分布式集群安装

本文档详细介绍了如何在已有的Hadoop和Zookeeper集群上安装Hive,并使用MySQL作为元数据存储。从解压Hive安装包,设置环境变量,拷贝MySQL驱动,初始化元数据库,到集群管理及连接,每一步都提供了清晰的操作步骤,最后还推荐了可视化工具DBeaver进行连接。


1 资源

apache-hive-3.1.1-bin.tar.gz

提取码:lzm1

2 环境

IP HOST
104.21.51.1 zk01
104.21.51.2 zk02
104.21.51.3 zk03

3 安装Hadoop

Hadoop分布式集群搭建(含Zookeeper安装)

4 安装MySQL

Hive默认的metadata(元数据)是存储在Derby里面的,但是有一个弊端就是同一时间只能有一个Hive实例访问。
所以我们选择使用MySQL来替换Derby,实现多实例同时访问。

MySQL安装

5 Hive集群安装

5.1 解压安装包

mkdir /hive
tar -zxvf apache-hive-3.1.1-bin.tar.gz -C /hive

5.2 设置环境变量并使之生效

vi /etc/bashrc

export HIVE_HOME=/hive/apache-hive-3.1.1-bin
export PATH=$HIVE_HOME:$PATH

source /etc/bashrc

5.3 拷贝MySQL驱动到lib目录

cd $HIVE_HOME/lib

mysql-connector-java-8.0.18.jar

提取码:r0ch

5.4 修改配置文件

vi $HIVE_HOME/conf/hive-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <!-- JDBC连接字符串 -->
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://104.21.51.1:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=utf8</value>
    </property>
    <!-- JDBC驱动 -->
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.cj.jdbc.Driver</value>
    </property>
    <!-- 连接MySql的用户名 -->
    <property>
### 在 VirtualBox 分布式集群环境中安装和配置 Hive 在 VirtualBox 中搭建分布式集群安装 Hive,需要完成以下几个方面的配置:操作系统环境准备、Hadoop 集群搭建、Hive安装与配置以及相关依赖软件的安装。以下是详细的说明: #### 1. 操作系统环境准备 首先,确保 VirtualBox 中已正确安装 CentOS 系统,并且配置了足够的资源(如内存和硬盘空间)。根据引用内容[^1],建议为每个虚拟机分配至少 1024MB 内存和 20GB 虚拟硬盘。此外,确保虚拟机能够正常启动并保存状态,避免跳过安装界面导致系统无法持久化。 #### 2. Hadoop 集群搭建 Hive 是基于 Hadoop 的数据仓库工具,因此需要先搭建 Hadoop 分布式集群。根据引用内容[^4],可以按照以下步骤进行: - 创建存放数据的位置:`mkdir data` - 安装 JDK:通过 `yum -y install jdk-8u221-linux-x64.rpm` 安装 JDK。 - 查找 JDK 目录:使用 `whereis javac` 和 `ll /usr/bin/javac` 等命令确认 JDK 安装路径。 - 配置 Hadoop 环境变量:在 `.bashrc` 文件中添加以下内容[^3]: ```bash export HADOOP_HOME=<hadoop-install-dir> export PATH=$HADOOP_HOME/bin:$PATH ``` - 启动 Hadoop 集群:确保 HDFS 和 YARN 服务正常运行。 #### 3. Hive安装与配置 完成 Hadoop 集群搭建后,可以开始安装和配置 Hive。根据引用内容[^2]和[^3],具体步骤如下: - 下载 Hive 安装包:从 Apache 官方网站下载 Hive 二进制版本,例如 `apache-hive-2.3.7-bin.tar.gz`。 - 解压并重命名:将解压后的文件夹重命名为 `hive`,放置在合适的位置(如 `/opt/hive`)。 - 配置环境变量:在 `.bashrc` 文件中添加以下内容: ```bash export HIVE_HOME=<hive-install-dir> export HIVE_CONF=$HIVE_HOME/conf export PATH=$PATH:$HIVE_HOME/bin ``` - 配置 Hive 元数据存储:Hive 默认使用 Derby 数据库作为元数据存储,但在分布式环境中推荐使用 MySQL。根据引用内容[^5],可以通过以下步骤安装 MySQL: - 创建 MySQL 文件夹:`mkdir /export/software/mysql` - 下载 MySQL RPM 包:`wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm` - 安装 MySQL:`yum -y install mysql-community-release-el7-5.noarch.rpm` - 配置 MySQL 并创建 Hive 元数据库。 - 修改 Hive 配置文件: - 编辑 `hive-site.xml` 文件,添加以下内容以指定 MySQL 作为元数据存储: ```xml <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://<mysql-host>:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.cj.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive_user</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>hive_password</value> </property> ``` #### 4. 测试 Hive 安装 完成上述配置后,可以测试 Hive 是否正常工作: ```bash hive ``` 如果成功进入 Hive CLI,则说明安装和配置正确。 --- ###
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值