hive架构及工作原理

bigdata_ruiye

已于 2022-04-02 09:39:29 修改

阅读量260

点赞数

分类专栏： hive 文章标签： hive

于 2021-11-17 15:11:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40766600/article/details/121377285

版权

hive 专栏收录该内容

7 篇文章

订阅专栏

1 hive架构

1.1 组成及作用

用户接口：
1. clientcli（hive shell）、jdbc/ODBC（java访问hive）、webUI（浏览器访问hive）
2. 元数据meta store
  1. 表所属的数据库
  2. 表名
  3. 列、分区字段
  4. 表的类型
  5. 表所在的数据目录
  6. 注：默认存储在自带的Derby数据库中，一般使用mysql出处Metastore
3. 底层存储: HDFS
4. 计算：MapReduce
5. 驱动器Driver：接收/响应客户端请求
6. 解释器 SQL Parser: 将SQL文本转化为AST抽象语法树，对AST进行语法分析，比如表、字段是否存在、SQL语义是否错误
7. 编译器 Physical Plan：将AST编译生成逻辑执行计划
8. 优化器 Query Optimizer: 对逻辑执行计划进行优化
9. 执行器 Execution ：将逻辑计划转化成可执行的物理计划。对hive来说就是 mr、spark

2 hive工作原理

用户创建数据库、表信息，存储在元数据库中
向表中加载数据，元数据记录hdfs存储路径与表之间的映射关系
执行查询语句，首先经过解释器、编译器、优化器、执行器，将指令翻译成MapReduce，提交到yarn上执行，最后将执行结果输出到用户交互接口

博客等级

码龄8年

29
原创

14
点赞

39
收藏

85
粉丝

关注

私信

热门文章

分类专栏

算法
hive 7篇
olap 1篇
CDH平台 3篇
Hadoop 1篇
数据质量 1篇
数据湖 1篇
Linux 4篇
java 1篇
Zookeeper 1篇
工具 6篇

展开全部收起

上一篇：: Presto

下一篇：: hive 工作总结1

最新评论

dbeaver
lingmen2000: 第一步：DBeaver 的正确发音是?
dbeaver
御风蒲公英: 这个安装和使用挺简单最恶心的问题是老是断开连接没法保持连接 5-6分钟不动就断了版本是社区版21.3 大佬知道嘛？用了快一年了都没找到合适的法子
git冲突解决方法
weixin_37763484: 谢谢

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。