hive架构及工作原理

1 hive架构

1.1 组成及作用

  1.  用户接口:
    1. clientcli(hive shell)、jdbc/ODBC(java访问hive) 、webUI(浏览器访问hive)
    2. 元数据meta store
      1. 表所属的数据库
      2. 表名
      3. 列、分区字段
      4. 表的类型
      5. 表所在的数据目录
      6. 注:默认存储在自带的Derby数据库中,一般使用mysql出处Metastore
    3. 底层存储: HDFS
    4. 计算:MapReduce
    5. 驱动器Driver:接收/响应客户端请求
    6. 解释器 SQL Parser:  将SQL文本转化为AST抽象语法树,对AST进行语法分析,比如表、字段是否存在、SQL语义是否错误
    7. 编译器 Physical Plan:将AST编译生成逻辑执行计划
    8. 优化器 Query Optimizer: 对逻辑执行计划进行优化
    9. 执行器 Execution : 将逻辑计划转化成可执行的物理计划。对hive来说就是 mr、spark

    2 hive工作原理

  1. 用户创建数据库、表信息,存储在元数据库中
  2. 向表中加载数据,元数据记录hdfs存储路径与表之间的映射关系
  3. 执行查询语句,首先经过 解释器、编译器、优化器、执行器,将指令翻译成MapReduce,提交到yarn上执行,最后将执行结果输出到用户交互接口

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值