Hive知识点总结

Hive知识点总结
一、HIVE是什么?
Hive™数据仓库软件有助于使用SQL读取,编写和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。提供了命令行工具和JDBC驱动程序以将用户连接到Hive。
在这里插入图片描述

二、理解HIVE架构
在这里插入图片描述
在这里插入图片描述
驱动器:Driver
1)解析器(parser):将查询字符串转化为解析树表达式。
2)语义分析器(semantic analyzer):将解析树表达式转换为基于块(block-based)的内部查询表达式。
3)逻辑策略生成器(logical plan generator):将内部查询表达式转换为逻辑策略,这些策略由逻辑操作树组成。
4)优化器(optimizer):通过逻辑策略构造多途径并以不同方式重写。
三、HIVE执行流程

在这里插入图片描述
流程大致步骤为:
客户端连接Hive的Driver提交请求,Driver访问MetaStoreServer元数据查看文件是否存在,如果不存在就发给客户端文件不存在,如果存在就由Hive的Driver编译解释成MapReduce作业提交给hadoop执行,然后由Driver将结果返回给客户端。
(本质上,所

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值