Hive sql 执行计划实例1

最新推荐文章于 2025-03-16 21:58:09 发布

Michael_Shentu

最新推荐文章于 2025-03-16 21:58:09 发布

阅读量602

点赞数

CC 4.0 BY-SA版权

分类专栏： Hive 分布式数据仓库

本文链接：https://blog.youkuaiyun.com/shenxiaoming77/article/details/49475105

Hive 分布式数据仓库专栏收录该内容

10 篇文章

订阅专栏

本文解析了一条Hive SQL语句的执行计划，该语句用于从hot_news表中选择并按news_id排序后的前15条记录。执行计划包括了Stage依赖、MapReduce操作及各阶段的详细步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

hive>explain select news_id from hot_news order by news_id limit 15;

该sql的执行计划如下：

STAGE DEPENDENCIES:
Stage-1 is a root stage
Stage-0 depends on stages: Stage-1

STAGE PLANS:

Stage: Stage-1

Map Reduce
Map Operator Tree:
TableScan
alias: hot_news
Statistics: Num rows: 5536 Data size: 553707 Basic stats: COMPLETE Column stats: NONE
Select Operator
expressions: news_id (type: string)
outputColumnNames: _col0
Statistics: Num rows: 5536 Data size: 553707 Basic stats: COMPLETE Column stats: NONE
Reduce Output Operator
key expressions: _col0 (type: string)
sort order: +

Statistics: Num rows: 5536 Data size: 553707 Basic stats: COMPLETE Column stats: NONE

Reduce Operator Tree:
Select Operator
expressions: KEY.reducesinkkey0 (type: string)
outputColumnNames: _col0
Statistics: Num rows: 5536 Data size: 553707 Basic stats: COMPLETE Column stats: NONE
Limit
Number of rows: 15
Statistics: Num rows: 15 Data size: 1500 Basic stats: COMPLETE Column stats: NONE
File Output Operator
compressed: false
Statistics: Num rows: 15 Data size: 1500 Basic stats: COMPLETE Column stats: NONE
table:
input format: org.apache.hadoop.mapred.TextInputFormat
output format: org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat
serde: org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe

Stage: Stage-0
Fetch Operator
limit: 15
Processor Tree:
ListSink