hive是啥?
就是一个数据仓库,提供了一套类SQL查询的方法,让开发人员来组织数据。
它把SQL转换成了MapReduce,还对其进行了优化。果然是Hadoop中数据组织的利器。
下载地址:http://mirror.bit.edu.cn/apache/hive/
我的Hadoop是3.0.X。所以下载了个hive-3.0.0的。
解压到一个目录下。
配置环境变量 vi ~/.bash_profile
export HIVE_HOME=你的hive目录
export PATH=$PATH:$HIVE_HOME/bin
保存退出 :wq
导入生效 source ~/.bash_profile
查看版本 hive --version
看看能不能出来版本号?
进入到hive的conf目录下。看有没有hive-site.xml文件,没有的话拿default复制一份。
cp hive-default.xml.template hive-site.xml
修改hive配置文件,关联mysql。为啥?metastore_db,说是需要存储这个信息。
vi hive-site.xml<