文章目录
Hive基本操作
Hive查看SQL解析计划
我们都知道,hive在执行的时候会把所对应的SQL语句都会转换成MapReduce代码执行,但是具体的MR执行信息我们怎样才能看出来呢?这里就用到了explain关键字,他可详细的表示出在执行对应语句所对应的MR代码。语法格式如下;extended关键字可以更加详细的列举出代码的执行过程。
EXPLAIN [EXTENDED|DEPENDENCY|AUTHORIZATION] query
explain会把查询语句转化成stage组成的序列,主要由三方面组成:
- 查询的抽象语法树
- plane中各个stage的依赖情况
- 每个阶段的具体描述:描述具体来说就是显示出对应的操作算子和与之操作的对应的数据,例如查询select算子,filter算子,fetch算子等等。
下面来看一个具体的例子:
explain select * from students limit 10;
explain extended select * from students limit 10;
// extended 可选,可以打印更多细节
explain select a.id
,a.name
,a.clazz
,t1.sum_score
from(
select id
,sum(score) as sum_score
from score
group by id
)t1 right join (
select id
,name
,'文科一班' as clazz
from students
where clazz = '文科一班'
) a
on t1.id = a.id
order by t1.sum_score desc
limit 10;
Hive建表
格式:
CREATE [EXTERNAL] TABLE [

本文介绍了Hive的基本操作,包括查看SQL解析计划和建表方法。讲解了如何创建内部表和外部表,以及它们的区别。强调了在删除内部表时数据会一同删除,而外部表只删除元数据。还提到了建表时指定存储格式和使用SQL语句创建表的场景。
最低0.47元/天 解锁文章
2055

被折叠的 条评论
为什么被折叠?



