hadoop安装hive

本文详细介绍了在CentOS7系统中安装和配置Hive的过程,包括下载并移动hive安装包至共享目录,解压及创建符号链接,以及配置环境变量等关键步骤,确保Hive能在Hadoop集群中正常运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

centos7搭建hadoop高可用(ha)集群:https://blog.youkuaiyun.com/greatxiaoting/article/details/82761223   或

centos7搭建hadoop分布式集群:https://blog.youkuaiyun.com/greatxiaoting/article/details/81571187

1.将hive安装包移动到windows系统和centos的共享目录

1)下载hive安装包

apache-hive-2.1.0-bin.tar.gz下载地址:https://pan.baidu.com/s/1m00O7WMCHmb5INc3i8EPkg

2)hive安装包复制到windows系统和centos的共享目录

共享目录设置参考:https://blog.youkuaiyun.com/greatxiaoting/article/details/81515065

2.安装hive

1)s101虚拟机进入hive安装包所在的共享目录

cd /mnt/hgfs/share/

2)解压hive安装包

tar -xzvf apache-hive-2.1.0-bin.tar.gz -C /soft

3)创建hive符号链接

cd /soft

ln -s apache-hive-2.1.0-bin hive

3.配置环境变量

1)打开环境变量配置文件

vim /etc/profile

2)添加环境变量信息

export HIVE_HOME=/soft/hive
export PATH=$PATH:$HIVE_HOME/bin

3)生效环境变量

source /etc/profile

4)验证环境变量是否配置成功

hive --version

### 安装 Hive 3 并与 Hadoop 集成 要在 Ubuntu 上安装 Hive 3 并将其与 Hadoop 集成,以下是详细的说明: #### 1. 准备工作 确保已经完成以下准备工作: - 已经安装并配置好 Hadoop 环境,并能够正常运行[^3]。 - JDK 已正确安装并设置环境变量[^2]。 #### 2. 下载 Hive 3 压缩包 访问 Apache Hive 的官方网站下载最新版本的 Hive 3 压缩包。假设已将压缩包放置于 `build` 文件夹中,则可以通过如下方式解压和移动文件: ```bash cd ~/build tar -zxvf apache-hive-3.x-bin.tar.gz -C /usr/local/ mv /usr/local/apache-hive-3.x-bin /usr/local/hive ``` #### 3. 设置 Hive 环境变量 编辑 `.bash_profile` 或者 `/etc/profile` 文件,添加 Hive 路径至环境变量中: ```bash gedit ~/.bash_profile ``` 在文件末尾追加以下内容: ```bash export HIVE_HOME=/usr/local/hive export PATH=$PATH:$HIVE_HOME/bin ``` 执行以下命令使更改生效: ```bash source ~/.bash_profile ``` #### 4. 初始化 MySQL 数据库作为元数据存储 由于 Hive 默认使用 Derby 存储元数据,而生产环境中推荐使用外部数据库(如 MySQL),因此需要先安装 MySQL 并创建相应的数据库表结构[^5]。 ##### (a) 安装 MySQL Server 如果尚未安装 MySQL,请按照以下步骤操作: ```bash sudo apt-get update sudo apt-get install mysql-server ``` ##### (b) 创建用于存储 Hive 元数据的数据库及用户 登录到 MySQL 控制台: ```bash mysql -u root -p ``` 执行以下 SQL 命令以创建新数据库以及授权给特定用户: ```sql CREATE DATABASE hive_db; USE hive_db; GRANT ALL PRIVILEGES ON hive_db.* TO 'hive_user'@'localhost' IDENTIFIED BY 'password'; FLUSH PRIVILEGES; EXIT; ``` #### 5. 修改 Hive 配置文件 进入 Hive 的配置目录并修改必要的参数以便连接到刚才建立好的 MySQL 实例上: ```bash cd $HIVE_HOME/conf cp hive-default.xml.template hive-site.xml ``` 打开 `hive-site.xml` 进行编辑,在其中加入下面这些键值对来指定 JDBC URL 和驱动类名等信息: ```xml <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hive_db?createDatabaseIfNotExist=true&useSSL=false</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.cj.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hive_user</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>password</value> </property> ``` #### 6. 解决依赖冲突问题 有时可能会遇到某些 jar 包之间的版本不兼容情况,比如 JLine 库可能引起错误。可以尝试从其他地方获取合适的版本替换掉默认的那个或者直接拷贝过去解决这个问题[^4]: ```bash cp /path/to/correct-jline-version.jar $HIVE_HOME/lib/ rm $HIVE_HOME/lib/jline*.jar ln -s correct-jline-version.jar jline.jar ``` 另外还需注意的是 YARN 中也需要有相同的 JLine 版本来避免潜在的问题发生所以也要同步更新一下该路径下的对应文件副本: ```bash cp /usr/local/hive/lib/jline-2.12.jar /usr/local/hadoop/share/hadoop/yarn/lib ``` #### 7. 测试 Hive 是否能正常使用 最后一步就是验证整个流程是否顺利完成啦!启动服务之后就可以通过 CLI 来测试查询功能了哦~ ```bash start-dfs.sh && start-yarn.sh hiveserver2 & beeline -u jdbc:hive2://localhost:10000/default !connect jdbc:hive2://localhost:10000/default username password org.apache.hive.jdbc.HiveDriver show tables; desc formatted table_name; select * from your_table limit 10; ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值