环境如下
linux版本:CentOS 7.5.1804
jdk版本:jdk1.8.0_201
hadoop版本:hadoop-2.6.0-cdh5.10.0
hive版本:hive-1.1.0-cdh5.10.0
一、JDK
请参考文章 JDK1.8安装
二、安装Hadoop
请参考文章 安装hadoop2.6.0(伪分布式)
三、Mysql安装
本质上,hive只是个工具,包括它的数据分析,依赖于mapreduce,它的数据管理,依赖于外部系统。
这一步其实不是必须的,因为Hive默认的metadata(元数据)是存储在Derby里面的,但是有一个弊端就是同一时间只能有一个Hive实例访问,这仅适合做开发程序时做本地测试,无法多用户同时访问。
为此,Hive提供了增强配置,可将数据库替换成mysql等关系型数据库,将存储数据独立出来在多个服务示例之间共享。