Hive的3种执行引擎区别与适用场景

最新推荐文章于 2025-04-03 08:01:35 发布

菜鸡努力学习中

最新推荐文章于 2025-04-03 08:01:35 发布

阅读量7.5k

点赞数 5

分类专栏： Hive 文章标签： hive spark hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_45952294/article/details/121756853

版权

Hive 专栏收录该内容

4 篇文章

订阅专栏

Hive支持MapReduce、Tez和Spark三种执行引擎。MapReduce适合处理周期性指标，如周、月、年报表；Spark在多算子过程中减少磁盘IO，适用于天级别指标；Tez基于内存，适合快速出结果但需谨慎对待大数据量以避免OOM。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. Hive的3种执行引擎适用场景

● Hive底层的计算由分布式计算框架实现,目前支持三种计算引擎,分别是MapReduce、Tez、 Spark。
● Hive中默认的计算引擎是MapReduce ,由hive. execution. engine参数属性控制。

MapReduce引擎：多job串联，基于磁盘，落盘的地方比较多。虽然慢，但一定能跑出结果。一般处理，周、月、年指标。

Spark引擎：虽然在Shuffle过程中也落盘，但是并不是所有算子都需要Shuffle，尤其是多算子过程，中间过程不落盘 DAG有向无环图。兼顾了可靠性和效率。一般处理天指标。

Tez引擎：完全基于内存。注意：如果数据量特别大，慎重使用。容易OOM。一般用于快速出结果，数据量比较小的场景。

2. hive的引擎mapreduce、tez和spark三者比较

[转载]：https://www.jianshu.com/p/357fceaa4042

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。