hive下载、安装

本文介绍如何下载并安装Hive 3.1.2版本,包括配置日志路径及环境变量,以及初始化元数据库的过程。

下载

官方:
http://hive.apache.org/downloads.html
http://archive.apache.org/dist/hive/

清华镜像:
https://mirrors.tuna.tsinghua.edu.cn/apache/hive/

本文下载 3.1.2 版本

hive 3.x 支持 hadoop 3.x,与 hive2.x 相比,改动不大
hive 2.x 支持 hadoop 2.x

安装

  1. 把 apache-hive-3.1.2-bin.tar.gz 上传到 linux

  2. 解压 apache-hive-3.1.2-bin.tar.gz

tar -zxvf apache-hive-3.1.2-bin.tar.gz
  1. 修改 apache-hive-3.1.2-bin 的名字
mv apache-hive-3.1.2-bin apache-hive-3.1.2

修改日志路径

默认日志路径

/tmp/当前用户名/hive.log

/tmp 是linux临时路径,可能会清空掉日志

修改

文件 $HIVE_HOME/conf/hive-log4j2.properties.template 是日志模板文件,根据该文件 创建 日志配置文件

进入 conf 目录:

cd $HIVE_HOME/conf

根据模板复制配置文件:

cp hive-log4j2.properties.template hive-log4j2.properties

打开 hive-log4j2.properties:

vim hive-log4j2.properties

默认日志路径如下,即:/tmp/当前用户名/

property.hive.log.dir = ${sys:java.io.tmpdir}/${sys:user.name}

默认日志文件名:

property.hive.log.file = hive.log

修改日志路径

# property.hive.log.dir = ${sys:java.io.tmpdir}/${sys:user.name}
property.hive.log.dir = /devtools/apache-hive-3.1.2/logs/

添加环境变量

sudo vim /etc/profile

增加下面内容:

export HIVE_HOME=/devtools/apache-hive-3.1.2
export PATH=${HIVE_HOME}/bin:$PATH

初始化元数据库

这里使用默认derby

注意: 先进入 apache-hive-3.1.2 目录下:

cd apache-hive-3.1.2

执行初始化命令:

schematool -dbType derby -initSchema

注意: 在哪个目录下执行该命令,就会在哪个目录下创建 metastore_db 文件夹

看到下面提示表示安装成功:

Initialization script completed
schemaTool completed
### 下载安装 Apache Hive 到虚拟机 #### 准备工作 在开始之前,确保已经完成以下准备工作: - 虚拟机已成功启动并运行正常[^1]。 - 已经具备管理员权限或者 `sudo` 权限。 #### 步骤说明 #### 1. 安装必要的工具 为了能够顺利下载和配置 Hive,需要先确认系统中是否存在一些基础工具。如果尚未安装这些工具,则需通过如下命令进行安装: ```bash sudo apt-get update && sudo apt-get install wget vim -y ``` 上述命令会更新软件包索引,并安装 `wget` 和 `vim` 这两个常用工具[^2]。 #### 2. 下载 Hive 压缩包 可以通过官方镜像站点或其他可信资源获取最新版本Hive 压缩包。以下是具体操作方法: ```bash cd /usr/local/ sudo wget https://downloads.apache.org/hive/stable/apache-hive-x.y.z-bin.tar.gz ``` 注意:将 `x.y.z` 替换为你希望安装的具体版本号。 接着解压该压缩文件至目标路径: ```bash sudo tar -xzvf apache-hive-x.y.z-bin.tar.gz -C /usr/local/ ``` 最后重命名解压后的目录以便于管理: ```bash sudo mv /usr/local/apache-hive-x.y.z-bin /usr/local/hive ``` 以上步骤完成了 Hive 的初步部署[^4]。 #### 3. 配置环境变量 为了让系统全局识别 Hive 执行程序的位置,编辑 `.bashrc` 或者 `/etc/profile` 文件加入下面的内容: ```bash export HIVE_HOME=/usr/local/hive export PATH=$PATH:$HIVE_HOME/bin ``` 使更改立即生效可执行以下指令: ```bash source ~/.bashrc ``` 此时可以尝试输入 `hive --version` 查看是否能正确显示版本信息来验证设置是否有效。 #### 4. 创建必要配置文件 进入 Hive 的 conf 目录创建一个新的 XML 格式的配置文档用于定义数据库连接参数等重要选项: ```bash cd $HIVE_HOME/conf/ cp hive-default.xml.template hive-site.xml vi hive-site.xml ``` 在此处可以根据实际需求调整各项属性值,比如 JDBC URL 地址指向本地 MySQL 实例作为元数据存储服务端点之一[^3]。 #### 总结 至此,在 Linux 系统下的虚拟环境中已完成从零构建起支持大数据分析功能所需的 Hive 组件全过程描述。按照上述指南一步步实施即可顺利完成整个过程。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值