Hive On Spark

最新推荐文章于 2025-07-04 16:40:45 发布

阿仙13

最新推荐文章于 2025-07-04 16:40:45 发布

阅读量3.6k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：大数据文章标签： hive on spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/mousezhengph/article/details/79026063

本文档详细介绍了如何将Hive 2.3.0的执行引擎从MapReduce切换到Spark 2.0.2，包括删除预发布版本中与Hive冲突的jar包，确保Hive和Spark版本的兼容性，以及编译Spark源码，最后配置环境并验证设置成功。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前数据仓库使用的是hive新版本2.3.0, hive以MapReduce程序跑在yarn集群上。

hive shell常提示：

Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive 1.X releases.

意思是或者使用Hive1.x/ 或者给hive换个引擎。正好最近需要搭建Spark集群，正好把hive的执行引擎给换掉。

hive 官方文档：https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark:+Getting+Started

网上查说坑很多，但其实文档写的很清楚。主要注意以下两点：

1）默认spark预发布版本里有hive的jar包(大概是SparkSQL访问Hive用的)，要想使用hive on spark 就需要去掉这些spark访问hive 的jar包。所以推荐使用spark源码自行编译spark.

2) 一定要注意hive版本与spark版本的兼容性。 hive源码的pom.xml 里 spark.version 定义了hive支持的spark版本。

hive2.3.0支持 spark 2.0.0，很坑，用spark2.2.0试过，不好使。

详述安装配置过程：

java 1.8.0

hadoop 2.7.4

hive 2.3.0

spark 2.0.2 注：spark 使用yarn进行调度，官方文档有一句：Hive on Spark supports Spark on YARN mode as default.

一) 安装JDK/maven/scala/

安装maven是为了编译spark。

下载scala版本2.11.12 ，spark从2.X版本使用scala的2.11.X版本

安装scala:

 
 rpm -Uvh scala-2.11.12.rpm 

 
 二）spark编译 

 
 tar -zxvf spark-2.0.2.tgz -C /

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄19年

1
原创

1
点赞

4
收藏

0
粉丝

关注

私信

热门文章

Hive On Spark 3608

分类专栏

iOS
大数据 1篇

最新评论

Hive On Spark
yukiknow: 根据你的步骤配了，发现不能实现hive on spark 其中如下的不然就不行，这些内容要配在hive-site.xml里面才行，至少spark引擎才被hive用上： 2.在hive的conf下建立文件spark-defaults.conf set hive.execution.engine=spark; set spark.master=yarn; set spark.submit.deployMode=client; set spark.eventLog.enabled=true; set spark.eventLog.dir=hdfs://bi/spark-logs; // 这个是HA的hdfs地址，在hadoop的core-site.xml里可以找到。 set spark.executor.memory=1024m; set spark.serializer=org.apache.spark.serializer.KryoSerializer;

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。