Hive是基于Hadoop的数据仓库解决方案,可以将结构化的数据文件映射为数据库表,用类sql的查询语句HQL进行操作。
简单说说Hive的优势和特点:
提供了一个简单的优化模型
HQL类SQL语法,简化MR开发
支持在不同的计算框架上运行
支持在HDFS和HBase上临时查询数据
支持用户自定义函数、格式
成熟的JDBC和ODBC驱动程序,用于ETL和BI
稳定可靠(真实生产环境)的批处理
有庞大活跃的社区
安装配置Hive之前,最好先配置好zookeeper,我们先从zoo开始解压。
tar -zxf zookeeper-3.4.5-cdh5.14.2.tar.gz
mv zookeeper-3.4.5-cdh5.14.2 soft/zk345
解压好zookeeper压缩包,在移动到创建的zoo文件夹下。
然后打开文件夹,进入到conf配置文件下,查看一下有没有zoo_sample.cfg,然后将它复制到新的zoo.cfg
配置文件里,然后进入修改它。


修改红框框里的两项就可以了,配置完就可以保存退出。
然后要在虚拟机的配置文件里配置zookeeper的环境变量。如图下配置完,重新激活成功就可以啦。
vi /etc/profile
source /etc/profile

接着开始弄Hive,下载好Hive的压缩包 这里我使用的是1.1.0版本,将压缩包复制到虚拟机中

然后开始解压hive包,然后将解压出来的文件移动到创建的hive文件夹下
tar -zxf hive-1.1.0-cdh5.14.2.tar.gz
mv hive-1.1.0-cdh5.14.2 soft/hive110
接着进入hive的conf配置文件夹下,新建一个hive-site.xml文件进行配置。

代码如下

本文介绍了如何在Hadoop环境中配置Hive数据仓库,并强调了Hive的优势,包括类SQL查询、支持多种计算框架等。在配置Hive前,先详细说明了如何设置和配置Zookeeper。通过解压、复制、修改配置文件以及配置环境变量等步骤,逐步解析了Hive的安装和配置过程。
最低0.47元/天 解锁文章
3259

被折叠的 条评论
为什么被折叠?



