最近在学习Hive的安装与使用,第一次使用还是遇到了很多问题。下面介绍下具体的过程。
开发环境:
ubuntu10.04
jdk:1.7.0_40
Hadoop:1.2.1
1、下载安装包
首先从http://hive.apache.org/downloads.html下载并解压到一个目录下,笔者是/root/hive。
Hiva需要Hadoop已经启动并运行,所以先得运行hadoop。然后在HDFS中配置几个目录备用
2、配置HDFS中的目录
bin/hadoop fs -mkdir /tmp
bin/hadoop fs -mkdir /user/hive/warehouse
bin/hadoop fs -chmod g+w /tmp
bin/hadoop fs -chmod g+w /user/hive/warehouse
3、配置共享SQL数据库
Hive部署在多用户环境中,就需要有一个集中的地方存储数据。通常会使用一个共享的SQL数据库,如mysql,但任何符合JDBC的数据库都是可以的,这里以mysql为例。
安装mysql ,执行如下命令:

本文档详细介绍了在Ubuntu 10.04环境下,如何安装和配置Hive,包括下载Hive安装包,设置Hadoop的HDFS目录,配置共享SQL数据库MySQL,以及修改Hive的配置文件。在安装过程中,特别提到了需要预先运行Hadoop,并为Hive创建特定的HDFS目录,以及在MySQL中创建metastore_db数据库和赋予用户权限。在遇到HBase与Hive冲突时,提出了可能的解决办法。
最低0.47元/天 解锁文章
743

被折叠的 条评论
为什么被折叠?



