目录
一、前言
上一篇,我们分享了hive表数据常用的优化策略,本篇再从hive的job执行层面来聊聊可以优化的常用的一些手段。
二、hive执行计划
在正式分享job优化之前,有必要先了解下hive的一条sql执行时经历的事情,即explain执行计划,在学习mysql的时候,DBA或者开发人员经常通过explain关键字来分析一条慢sql的执行计划,从而指导sql优化。
2.1 hive explain简介
HiveQL,是一种类SQL语言,从编程语言规范来说是一种声明式语言,用户会根据查询需求提交声明式的HQL查询,而Hive会根据底层计算引擎将其转化成Mapreduce/Tez/Spark的job;
hive explain 补充说明:
- 使用hive的explain命令可以帮助用户了解一条HQL语句在底层的实现过程,通俗
本文详细介绍了Hive的job任务优化策略,包括hive explain的使用、MapReduce属性优化如本地模式、JVM重用和并行执行,以及join操作的Map Join、Reduce Join和Bucket Join的优化。此外,还探讨了谓词下推、优化器和数据倾斜的解决方案,为Hive性能提升提供全面指导。
订阅专栏 解锁全文
8854





