Hive提供的执行计划目前可以查看的信息有以下几种:
● 查看执行计划的基本信息,即explain;
● 查看执行计划的扩展信息,即explain extended;
● 查看SQL数据输入依赖的信息,即explain dependency;
● 查看SQL操作相关权限的信息,即explain authorization;
● 查看SQL的向量化描述信息,即explain vectorization。
MR引擎下,用explain打开的执行计划包含以下两部分:
● 作业的依赖关系图,即STAGE DEPENDENCIES;
● 每个作业的详细信息,即STAGE PLANS。
举个栗子:

执行结果如下:


解读:
- stage dependencies描绘了作业之间的依赖关系,
即stage0依赖stage-1的执行结果。stage-0表示客户端读取stage-1的执行结果
stage-1表示如下SQL,即select *from student_tb_orc where s_age<30 and s_

本文介绍了Hive中查看SQL执行计划的几种方式,包括基本信息、扩展信息、数据依赖、权限信息和向量化描述。通过示例解释了MR引擎下的执行计划组成部分,如Stage Dependencies和Stage Plans,并详细解析了MapReduce阶段的各个Operator,如TableScan、Filter、Select和Group By等。同时提到了explain dependency用于描述数据来源,explain authorization获取访问权限信息,以及explain vectorization查看向量化执行模式。
最低0.47元/天 解锁文章
1880

被折叠的 条评论
为什么被折叠?



