Hive安装前准备
服务器基础环境
集群时间同步(集群时间同步可参考:Hadoop中时间同步配置)
防火墙关闭
主机Host映射
SSH免密登录
JDK安装
Hadoop集群健康可用
Hive启动之前必须先启动Hadoop集群,需要等待HDFS安全模式关闭之后再启动运行Hive
Hive并不是分布式安装运行的软件,其分布式特性主要借助Hadoop完成,包括分布式存储、分布式计算
HDFS安全模式开启关闭可参考:Hadoop安全模式怎么关了
Hadoop与Hive整合
Hive需要把数据存储在HDFS上,并且通过MapReduce作为执行引擎处理数据,需要在Hadoop中添加相关配置属性。
通过修改Hadoop中core-site.xml(若Hadoop集群已启动需要先将其关闭再进行修改),并且修改过的配置文件都需要在所有机器中同步,重启之后才能生效
MySQL安装
MySQL只需要一台机器安装并授权远程访问。
卸载CentOS7自带的mariadb